Cloudera Workbench, il data science self-service facile e sicuro

Data Security e Data Privacy

Cloudera annuncia la disponibilità generale di Data Science Workbench, soluzione facile e sicura per accelerare data science e apprendimento automatico nelle imprese.

Cloudera Data Science Workbench, annunciato in versione beta nel corso di Strata + Hadoop World San Jose 2017, mette a disposizione delle imprese un data science veloce ed efficiente in modalità self-service. 

Grazie a Python, R e Scala direttamente nel browser web, Data Science Workbench offre agli utenti la possibilità di scaricare e sperimentare le librerie e i framework più recenti in ambienti di progetto personalizzabili. Data Science Workbench è sicuro e compatibile, con supporto per l’autenticazione, l’autorizzazione, la crittografia e la governance in Hadoop.

Data Science Workbench si integra facilmente con molti framework di deep learning, tra cui BigDL, una libreria di deep learning per Apache Spark, in open source da Intel. Creato per essere eseguito su infrastrutture distribuite Spark/Hadoop e con prestazioni ottimizzate per l’esecuzione su processori Intel Xeon (sfruttando la libreria Intel Math Kernel), BigDL opera direttamente all’interno di Data Science Workbench. 

I vantaggi dell’integrazione di BigDL in Data Science Workbench includono la capacità di sfruttare le librerie e le tattiche di deep learning sull’architettura della CPU senza ulteriori necessità hardware o ambienti separati. La combinazione, infatti, fornisce un modo conveniente per creare pipeline data science Spark in modo nativo e integrarle con la libreria di deep learning (BigDL) e altri componenti Spark/Hadoop su Data Science Workbench.

L’ufficio delle statistiche nazionali (ONS), il più grande produttore indipendente di statistiche ufficiali del Regno Unito, pianifica di utilizzare Data Science Workbench per creare ricerche statistiche ripetibili, precise e trasferibili.

Charles Zedlewski, vice president senior Products, Cloudera
Stiamo entrando nell’era d’oro dell’apprendimento automatico e tutto è incentrato sui dati. Tuttavia, i data scientist continuano a faticare per creare e testare nuovi progetti analitici alla velocità desiderata, soprattutto in ambienti di grandi dimensioni. Data Science Workbench è uno strumento self-service che accelera la capacità di creare, scalare e implementare soluzioni di apprendimento automatico utilizzando le tecnologie più potenti. Ciò significa che i data scientist oggi hanno la libertà di collaborare, condividere e gestire i propri dati nella modalità che meglio si adatta alla loro attività e alla loro azienda, agevolando un percorso più semplice e veloce per la produzione.

Simon Sandford-Taylor, Chief Technology Officer, ONS
Abbiamo accertato un tempo inferiore nello sviluppo di modelli e una maggiore visibilità nel monitoraggio dei progressi e dei risultati. Riteniamo che Cloudera Data Science Workbench abbia il potenziale per accelerare il nostro calendario di rilascio e per condividere meglio le best practice.

Michael Greene, vice president e general manager System Technologies and Optimization del gruppo Software and Services, Intel Corporation
I clienti enterprise richiedono una piattaforma logica per scalare le proprie soluzioni di analisi e massimizzare gli investimenti. L’integrazione nativa di BigDL con Apache Spark porta il mondo del deep learning nell’ecosistema di Apache Spark e un valore più elevato per i clienti aziendali. Il framework BigDL aiuterà i clienti aziendali a utilizzare meglio gli investimenti esistenti per creare le proprie competenze analitiche con prestazioni ottimizzate sull’architettura Intel.