Data lake e non solo: Snowflake Polaris Catalog

data lake

Snowflake Polaris Catalog: un’implementazione di catalogo aperta e vendor-neutral per l’implementazione di data lakehouse, data lake e altre architetture moderne.

Polaris Catalog sarà reso disponibile nei prossimi 90 giorni per fornire alle aziende e all’intera comunità Iceberg nuovi standard di flessibilità, scelta e controllo sui propri dati, con una sicurezza di livello entreprise completa e l’interoperabilità di Apache Iceberg con Amazon Web Services (AWS), Confluent, Dremio, Google Cloud, Microsoft Azure, Salesforce e altri ancora.

Christian Kleinerman, EVP of Product di Snowflake
Le imprese desiderano uno storage aperto e motori di query interoperabili, senza alcun lock-in. Ora, con il supporto dei leader del settore, stiamo semplificando ulteriormente il modo in cui ogni organizzazione può accedere facilmente ai propri dati su sistemi diversi con ancora più flessibilità e controllo.
Polaris Catalog rafforza il nostro impegno nei confronti di Apache Iceberg come standard aperto di riferimento e conferma l’intenzione dei leader del settore di consentire ai clienti e alla più ampia comunità Iceberg di sfruttare i propri dati attraverso un approccio aperto e neutrale, garantendo l’interoperabilità tra i vari sistemi di gestione dei dati.

Data lakehouse, data lake e altre architetture moderne

Con Polaris Catalog, gli utenti hanno ora a disposizione un ambiente unico e centralizzato in cui qualsiasi motore può trovare e accedere alle tabelle Iceberg di un’organizzazione con un’interoperabilità completa e aperta. Si basa sul protocollo open source REST di Iceberg, che fornisce uno standard aperto agli utenti per accedere e recuperare i dati da qualsiasi motore che supporti le API Rest di Iceberg, tra cui Apache Flink, Apache Spark, Dremio, Python, Trino e altri.
Le aziende possono iniziare a utilizzare Polaris Catalog ospitato nell’AI Data Cloud Snowflake in pochi minuti – Snowflake-hosted, verrà rilasciato in public preview a breve – o auto-ospitarlo nella propria infrastruttura utilizzando container come Docker o Kubernetes. Poiché l’implementazione backend di Polaris Catalog sarà open source, le organizzazioni potranno cambiare liberamente l’infrastruttura di hosting eliminando ogni vendor lock-in.

La comunità Polaris Catalog

Un elemento che rende Apache Iceberg così potente è la sua vibrante comunità di utenti, collaboratori e operatori commerciali. Per garantire che Polaris Catalog possa soddisfare le esigenze in costante evoluzione della comunità e del settore, Snowflake sta collaborando con l’ecosistema Iceberg per portare avanti il progetto.
Questo segue la recente estensione della partnership tra Snowflake e Microsoft, che crea una maggiore interoperabilità tra Snowflake e Fabric.

Con le competenze di Snowflake, che costituiscono la base dei dati che alimentano i workload cross-cloud di migliaia di clienti globali nel campo dei dati e dell’intelligenza artificiale, e con l’innovazione e le competenze open source della comunità Iceberg, in rapida crescita, si continuerà a semplificare l’interoperabilità dei dati tra i vari motori.

Snowflake e l’open source

Polaris Catalog si aggiunge a una serie di recenti iniziative di Snowflake legate all’open source, come gli investimenti in Iceberg Tables, che consentono ai clienti Snowflake di continuare a lavorare con i dati nel proprio storage nel formato Apache Iceberg, beneficiando della facilità d’uso, delle prestazioni e della governance unificata di Snowflake.
Snowflake ha anche recentemente annunciato Snowflake Arctic, uno dei modelli linguistici di grandi dimensioni (LLM) di livello entreprise più aperti presenti sul mercato. Nell’ambito del suo impegno verso l’open source, Snowflake non solo ha rilasciato i risultati dell’addestramento di Arctic sotto licenza Apache 2.0, ma anche dettagli approfonditi su come è stato addestrato attraverso una serie di guide. Inoltre, Snowflake sostiene la comunità open source di Streamlit, che oggi conta oltre 275.000 sviluppatori attivi ogni mese e più di 6 milioni di visualizzazioni mensili sulle applicazioni.

Da quando Snowflake ha acquisito Streamlit nel marzo 2022, la community ha continuato a prosperare, crescendo di oltre il 500% negli ultimi due anni, poiché Snowflake e Streamlit continuano a investire in innovazioni open source all’avanguardia per gli sviluppatori.