Per accelerare le sue prestazioni data analytics e AI nel cloud, Cloudera Data Platform firma un accordo con NVIDIA. Cloudera Data Platform (CDP) così integrerà RAPIDS Accelerator per Apache Spark 3.0. Distribuito sulle piattaforme di elaborazione NVIDIA, il software consente alle imprese di accelerare le pipeline di dati.
Oltre a spingere i limiti delle prestazioni dei dati e dei flussi di lavoro di machine learning (ML) per favorire l’adozione dell’AI. E fornire migliori risultati di business, senza modificare alcun codice. Con il rilascio di Applied ML Prototypes (AMPs) in CDP e la potenza dell’elaborazione NVIDIA, clienti come l’Internal Revenue Service e l’Office for National Statistics UK possono non solo avviare out of the box casi d’uso di ML.
Ma accelerare l’elaborazione dei dati e la creazione dei modelli a un costo inferiore su qualsiasi implementazione on-premise, cloud pubblico o ibrido. I data engineer aziendali utilizzano set di dati su grandezza e scala mai viste prima. Ad esempio come la trasformazione dei modelli di supply chain, la risposta adeguata alla crescita delle frodi o lo sviluppo di nuove linee di prodotti.
Data analytics Cloudera NVIDIA
Per i data scientist, i colli di bottiglia creati dalle enormi quantità di dati hanno un impatto diretto sul costo e sulla velocità con cui le aziende possono far operare i modelli in tutta l’organizzazione. L’integrazione tra Cloudera e NVIDIA darà alle aziende la capacità di rispondere rapidamente alle sfide di business emergenti fornendo analisi approfondite.
Joe Ansaldi, IRS/Research Applied Analytics & Statistics Division (RAAS)/Technical Branch Chief
Dobbiamo essere in grado di prendere decisioni accurate in tempi rapidi sfruttando grandi quantità di dati. Si tratta di una sfida continua, poiché i volumi e le velocità dei dati continuano ad aumentare.L’accordo tra Cloudera e NVIDIA ci consentirà di utilizzare informazioni approfondite e data-driven per alimentare casi d’uso mission-critical quali il rilevamento delle frodi. In fase di implementazione di questa integrazione, stiamo già riscontrando miglioramenti della velocità di oltre tre volte per i nostri workflow di data engineering e data science.
Data analytics Cloudera NVIDIA – Per ogni azienda che si trova alle prese con enormi set di dati, una pipeline di data science accelerata da GPU open source fa la differenza tra essere in grado di formare i modelli o non essere in grado di farlo del tutto. Una pipeline di questo tipo può potenziare direttamente la capacità di trasformazione di un’organizzazione usando l’intelligenza artificiale. Apache Spark 3 accelerato da GPU viene eseguito senza problemi su CDP, consentendo alle organizzazioni di supportare le esigenze di HPC, AI e scienza dei dati – dalla ricerca alla produzione – con una piattaforma sicura, scalabile e aperta per il machine learning.