Quali riflessi sul business di un’azienda può avere una data-driven strategy? Per scoprirlo Cloudera ha realizzato uno studio in collaborazione con Vanson Bourne. Siccome la ricerca ha coinvolto anche l’Italia, abbiamo intervistato Fabio Pascali, Regional Director Italy di Cloudera, per saperne di più sui risultati ottenuti e se e come le nostre aziende stanno approcciando una strategia data driven.
– La ricerca vi ha fornito un’indicazione del valore che può avere per un’azienda una strategia data-driven?
Grazie al numero di aziende che hanno risposto siamo usciti a estrapolare dati sia a livello macro sia a livello Italia. Questo ci ha permesso di conoscere l’impatto del mondo dati sull’economia, quindi sulla crescita delle aziende e poi come le aziende lo stanno interpretando.
La ricerca ha confermato che una data-driven strategy porta a una crescita dell’azienda più veloce. Ovvero c’è circa il 5% di crescita in confronto all’anno precedente nelle aziende che utilizzano da più di 12 mesi una data-driven strategy rispetto a una crescita di circa il 2% di media delle aziende che non implementano tale strategia.
– I numeri sono eloquenti, ma quante aziende stanno realmente usando una data driven strategy?
Il panel intervistato era costituito da circa 3.600 aziende. Di queste, circa il 90% ha già realizzato o messo in cantiere un progetto legato a una strategia data-driven. Le grosse aziende, anche a livello italiano, sia pubbliche sia private, sia stanno dotando o si sono dotate anche di figure direzionali come il Chief Data Officer, che ha una responsabilità importante all’interno dell’azienda. Così come vediamo sempre più diffusa la crescita dei team di data scientist e di data engigneering. Si tratta di nuove professionalità che ormai si sono affermate per trasformare il dato in insight, quindi in valore.
– Che valore possono portare oggi i dati all’azienda?
Qualche tempo fa si diceva che il dato fosse il nuovo petrolio. In realtà, è diverso perché il petrolio si utilizza e lì finisce il suo valore. Mentre il dato continua ad avere valore dopo un utilizzo primario. L’idea di base è che in funzione del ciclo di vita del dato si può continuare ad estrarre del valore. All’inizio si ottengono determinati analytics legati al fatto che il processo di elaborazione avviene vicino all’edge dove il dato è estratto. Poi però il dato viene collezionato e archiviato in data lake per fare analisi storiche. Si può anche metterlo a disposizione di qualche altra azienda e quindi “monetizzarlo”. Un dato non muore dopo il primo utilizzo, ma continua un processo di vita importante.
– In termini di dati acquisizione dei dati, il vostro studio evidenzia nuove tendenze?
Finora il mondo degli analytics si è concentrato su sistemi corporate, però dalla ricerca emerge un’attenzione crescente verso gli edge, sia che si tratti di un sistema IoT sia di una supply chain. E questo grazie a due fattori: la tecnologia, che aiuta a raccogliere in maniera efficace ed efficiente i dati, e la possibilità di elaborarli in real time o near real time.
Infatti, in passato si raccoglievano i dati e si faceva un’analisi a posteriori, ma il fatto di poterli elaborare e arricchire vicino alla sorgente apre scenari completamente diversi. Per esempio, poter collezionare i dati di un sensore ed analizzarli immediatamente con degli algoritmi di machine learning è qualcosa che prima non si riusciva a fare. Il mondo dell’IoT fornirà sempre più dati per andare a lavorare su due dimensioni: l’incremento del fatturato e la riduzione dei costi.
– Ci sono delle industry che sono più inclini all’utilizzo dei dati?
Se guardiamo la parte in streaming, ovvero il mondo IoT, direi che il manufacturing fa la parte del leone. Ma ci sono anche altri settori dove nell’edge si possono collezionare dati ed elaborarli in tempo reale per generare servizi. Per esempio, nei mezzi di soccorso del pubblico o negli smart meter dell’energy. In ambito finance, il machine learning sta aiutando a rendere sempre più veloce il ritorno sull’investimento di un approccio data-driven. Anche le aziende delle comunicazioni raccolgono una quantità di dati importante e li elaborano per aumentare il livello di servizio.
– Dalla vostra indagine, che ruolo riveste il cloud nella data driven strategy?
Il machine learning e l’intelligenza artificiale stanno crescendo perché portano a ridurre i tempi di elaborazione e di risposta utilizzando i dati. Il cloud invece, è una risposta alla flessibilità e quindi alla rapidità con la quale si può costruire un modello di analytics.
Se le aziende sono in grado di aumentare il numero di sorgenti e di dati da catturare lo possono fare grazie appunto alla tecnologia e all’abbassamento dei suoi costi. Queste grandi moli di dati, poi, devono essere elaborate e gli algoritmi di intelligenza artificiale e machine learning sono esattamente la risposta a questo tipo di analisi.
Dall’altra parte il cloud, e in particolare l’hybrid cloud, sta aiutando le aziende a rendere sempre più flessibile l’utilizzo dei dati. Infatti, nell’hybrid cloud la stessa applicazione può dinamicamente spostarsi ed elaborare i dati on premise o in cloud. Questo è importante perché ci sono molte applicazioni che cambiano nel tempo. La variabilità rende l’utilizzo del cloud molto efficace perché quando io ho bisogno di risorse le sposto e le elaboro nel cloud, quando non ne ho più bisogno le più le posso spegnere e riportare i dati on premise.
Dallo studio si nota come la maggior parte delle aziende abbia già implementato una strategia hybrid cloud o la stia implementando.
– E quale quali sono i risultati in relazione alla sempre più diffusa tendenza verso il multicloud?
Quando il cloud diventa multicloud ci si stacca da un unico provider per sceglierne diversi in modo che efficacia ed efficienza aumentino ulteriormente. Il 36% delle aziende ha risposto che già oggi utilizzo un hybrid multicloud, il 26% un hybrid solo su un cloud e il 17% invece un hybrid con prevalenza on premise, il 6% solo on premise, il 6% solo su cloud e l’8% solo multicloud. Questo vuol dire che effettivamente la maggior parte delle aziende ha già implementato o sta implementando una strategia multicloud hybrid.
– Che ruolo può avere Cloudera all’interno di una strategia data-driven?
Gli hyperscaler per noi sono dei coopetitor, perché offrono servizi dati, ma sono molto complessi e parcellizzati. Propongono tante funzionalità ma che comunque vanno gestite e che richiedono un’integrazione. E quando si costruisce un’applicazione appoggiandosi alle funzionalità dati di un hyperscaler ci si lega a tale hyperscaler e quindi non si riuscirà facilmente a spostare un’applicazione su un altro cloud. Qui sta il valore aggiunto di un’azienda come Cloudera, ovvero di essere indipendente dal provider. Nella nostra proposta cloud sfruttiamo la potenzialità del cloud provider, il mondo dati, le risorse e il modo di essere efficace con le risorse. Ma lo facciamo con il nostro motore di gestione, con la nostra data platform. Quindi quando si costruisce un’applicazione on promise si può spostare nell’hybrid cloud e da un altro cloud provider, continuando ad avere lo stesso use case implementato e in maniera efficace.
Inoltre, Cloudera è open source al 100% e propone una soluzione dotata di sicurezza e di gestione built-in, quindi una sicurezza intrinseca e cross platform ovunque sia il dato, on promise, nel cloud o nell’hybrid cloud. Si ha poi un unico strumento di gestione e un unico strumento che governa la security.
Infine, riusciamo a gestire il dato end to end, dalla sorgente, al machine learning. Siamo una piattaforma abilitante, ma poi sono i sistemi integrator che costruiscono con le aziende le varie applicazioni. In passato a fare la differenza era la soluzione che si comprava, più o meno verticale, oggi a fare la differenza è invece il modo in cui si possono utilizzare meglio i dati, quali use case peculiare si riesce a costruire per l’azienda.