Intelligenza artificiale e dati: le novità Western Digital

I supporti e i sistemi di memorizzazione sono sempre più centrali, visto il continuo crescere delle applicazioni e degli usi dell’intelligenza artificiale.

intelligenza artificiale

Il 27 novembre Western Digital ha incontrato la stampa per presentare i suoi nuovi prodotti di classe enterprise per la memorizzazione dei dati, sia dischi meccanici sia memorie a stato solido, adatti all’addestramento e al funzionamento dell’intelligenza artificiale, il cui impiego e la cui pervasività sono sempre più universali. Ha condotto l’incontro Giorgio Ippoliti, Technologist, Field Applications Engineering Sales EMEA di Western Digital.

L’AI Data Cycle

I supporti e i sistemi di memorizzazione sono sempre più centrali, visto il continuo crescere delle applicazioni e degli usi dell’intelligenza artificiale. L’AI, infatti, ha bisogno di una enorme mole di dati sia per l’addestramento sia per funzionare e questi dati devono essere registrati su dischi e memorie che siano capienti e veloci, perché non basta memorizzare molti dati, è importante che si possano leggere (e scrivere) nel minor tempo possibile.

L’impiego dei dati da parte dell’intelligenza artificiale, in particolare quella generativa, può essere schematizzato in sei fasi, che rappresentano sostanzialmente un ciclo, l’AI Data Cycle:

  1. Raw data archives, content storage: si parte dai dati grezzi (documenti testuali, codice software, immagini, suoni, video), che vanno raccolti e archiviati nel loro formato digitale nativo oppure digitalizzati se sono di tipo analogico
  2. Data preparation & ingestion: le informazioni devono essere ripulite dalle parti inutili, non pertinenti, errate, e devono essere formattate in modo che siano utilizzabili dall’AI
  3. AI model training: l’intelligenza artificiale va addestrata tramite l’analisi di un’enorme quantità di dati, che devono essere letti nel minor tempo possibile, perché i processori usati in questa fase, le GPU, sono molto costosi e idealmente devono essere sempre fatti lavorare al massimo delle loro capacità
  4. Interface & prompting: l’AI deve interagire con l’utente umano e, per rendere la comunicazione più intuitiva, diretta e semplice possibile, l’interfaccia deve essere basata sul linguaggio naturale
  5. AI inference engine: una volta ricevuto il compito da eseguire, l’intelligenza artificiale si mette al lavoro e usa gli algoritmi addestrati nella fase 3
  6. New content generation: il risultato dell’elaborazione dell’AI è un testo, un codice software, un’immagine, un suono o un video. In tutti i casi si tratta di un risultato nuovo, generato ad hoc, che va naturalmente memorizzato per non andare perso, perché in ogni caso servirà per arricchire la base dati di partenza del ciclo

In tutte queste fasi è necessario leggere e scrivere dati su supporti dedicati, che possono essere caratterizzati da un’elevata capienza o da un’elevata velocità di scrittura e di lettura. I continui progressi nel campo delle tecnologie di memorizzazione digitale permettono oggi di avere anche supporti estremamente capienti e veloci (ideali per la fase 2), che quindi prendono il meglio dei due mondi: dischi meccanici e memorie a stato solido. Questo si ottiene però con costi molto elevati, quindi, quando non è strettamente necessario, si preferisce ancora ricorrere ai supporti relativamente più economici: dischi meccanici piuttosto lenti ma capaci di registrare grandi quantità di informazioni (fasi 1 e 6), memorie a stato solido estremamente veloci ma con capienza relativamente limitata (fasi 3, 4, 5).

intelligenza artificiale

Per il prossimo futuro, a causa dell’intelligenza artificiale Western Digital prevede un incremento del 20% dei dischi meccanici (HDD) di classe enterprise, una crescita del 30 – 40% dei dischi enterprise a stato solido (SSD Flash), un aumento del 25 – 35% degli SSD per i client e una crescita del 40 – 50% delle memorie flash per i dispositivi mobili (Western Digital è attiva anche in questo settore).

Secondo IDC, la quantità di dati memorizzati a livello mondiale passerà da 132 ZB (un ZB o zettabyte è pari a un miliardo di TB) nel 2023 a 394 ZB nel 2028, con un CAGR del 24%.

Le novità dell’offerta Western Digital per i dischi meccanici e a stato solido

Il catalogo dell’azienda americana è molto ricco e copre praticamente tutti i settori, da quello consumer fino all’enterprise e al data center. Per l’intelligenza artificiale il marchio propone i dischi meccanici Ultrastar DC HC680 e HC690, unità che impiegano la tecnologia SMR (Shingled Magnetic Recording, registrazione magnetica a strati parzialmente sovrapposti) e che arrivano a capienze di 28 e 32 TB, rispettivamente.

Giorgio Ippoliti

Giorgio Ippoliti
Per il prossimo futuro, Western Digital prevede che la capacità di memorizzazione dei dischi meccanici salirà ancora: da poco più di 30 TB di oggi a 40 nel 2026, 50 nel 2027 – 2028 e anche 100 TB in un futuro più lontano. Questa crescita sarà resa possibile principalmente dalla tecnologia di scrittura HAMR (Heat-Assisted Magnetic Recording, registrazione magnetica assistita dal calore fornito da un Laser), allo studio da anni e che teoricamente consente di aumentare di 100 volte la densità di dati per unità di superficie del disco magnetico.

Sul fronte dei dischi a stato solido per enterprise e data center, l’azienda ha presentato a inizio ottobre l’Ultrastar DC SN861, un’unità SSD NVMe estremamente veloce, progettata specificatamente per l’impiego con l’intelligenza artificiale e il machine learning. Il prodotto è disponibile nei tagli da 2, 4, 8, 16 TB, nei formati U.2, E1.S, E3.S ed è conforme agli standard PCIe Gen 5.0 e OCP 2.0.

intelligenza artificiale

Sempre di tipo SSD ma con capacità addirittura superiori a quelle dei dischi meccanici è la serie Ultrastar DC SN65x NVMe, anche questa presentata a inizio ottobre. Si tratta di dischi a stato solido con tagli da 16, 32, 64 TB, compatibili PCIe Gen 4.0 e OCP 2.0, disponibili nei formati U.3 ed E1.L.

Anche la crescita in capacità degli SSD sarà sostenuta nei prossimi anni. Western Digital prevede di raggiungere i 128 TB l’anno prossimo, 256 nel 2027 e 1 PB (1.000 TB) in un futuro poco più lontano.

Per le macchine client, l’azienda ha rilasciato da pochi giorni le memorie SSD Flash WD_BLACK SN7100 NVMe e WD Blue SN5000 NVMe. La serie SN7100 vanta un ottimo rapporto prezzo/prestazioni, arriva a 2 TB, è priva di memoria DRAM e ha un’interfaccia PCIe Gen 4.0. Con 7.250 MB/s in lettura e 6.900 MB/s in scrittura (è garantita la scrittura di 1.200 TB), rappresenta un passo in avanti rispetto alla serie SN770, dato che è del 35% più performante ed è due volte più efficiente dal punto di vista energetico.

I sistemi di memorizzazione per enterprise e data center

L’offerta di Western Digital non è limitata ai dischi meccanici e a stato solido, ma include anche sistemi completi, piattaforme dedicate alla memorizzazione, pensate per i data center e capaci di ospitare molte decine di dischi.

Ultrastar Data60/102

Ultrastar Data60 e Data102 Serie 3000 sono due dispositivi di tipo JBOD in formato 4U per rack, che accettano 60 oppure 102 dischi rispettivamente, e sono dotati di connettività SAS-4 24G. I dischi sono inseribili ed estraibili a caldo, dall’alto e senza bisogno di usare attrezzi. I due prodotti si distinguono dalla concorrenza per le tecnologie proprietarie ArticFlow e IsoVibe, studiate per ridurre il tasso di rottura dei dischi, fino al 62% in meno.

ArticFlow consiste in una gestione a tre zone dell’aria di raffreddamento dei dischi e dell’elettronica interna. La metà anteriore del settore dischi è raffreddata da un flusso dedicato, che poi è espulso dietro la macchina tramite due condotti laterali. L’altra metà dei dischi è investita da un altro flusso d’aria, che passa dal fronte attraverso un corridoio centrale. Parte di quest’aria è impiegata per raffreddare l’elettronica. Anche questi due flussi sono scaricati sul retro tramite le ventole posteriori. Con questo sistema anche i dischi in fondo alla macchina sono raffreddati in maniera adeguata, dato che sono investiti da aria fresca, non da quella surriscaldata dai dischi anteriori.

IsoVibe permette di ridurre le vibrazioni causate dai dischi in funzione, grazie a tagli nella PCB a cui sono collegate le unità meccaniche di memorizzazione. Ogni disco è attaccato a una parte della scheda libera di oscillare ma che quasi non trasmette queste vibrazioni al resto della macchina. In questo modo le vibrazioni di un disco non disturbano le altre unità.

OpenFlex Data24

Un altro prodotto per data center dedicati all’intelligenza artificiale, rinnovato di recente, è OpenFlex Data24, nelle versioni 4100 e 4200. È una piattaforma di memorizzazione JBOF che impiega fino a 24 unità SSD NVMe, che grazie a una connessione veloce (fino a 12 porte 100 GbE) sono viste dal sistema come se fossero montate direttamente dentro il server.

intelligenza artificiale

Il prodotto è compatibile con i più recenti dischi a stato solido di Western Digital, come il già citato Ultrastar DC SN655 da 61,44 TB, così da arrivare a una capacità massima di 1.474,56 TB in un case 2U per rack. Questa soluzione consente di disaccoppiare la parte di memorizzazione dalla parte di calcolo, per allocare le risorse di storage in maniera dinamica.

Ultrastar Transporter

Ultrastar Transporter è una piattaforma per il trasferimento fisico dei dati. Ha una capacità massima di 368 TB grazie a 24 unità SSD NVMe Ultrastar SN650 e include una connettività a doppia porta 200 GbE. Il dispositivo pesa 13,6 kg ed è facilmente trasportabile in una custodia a prova di manomissione, che garantisce la massima sicurezza dei dati.

Questo prodotto risponde all’esigenza di dover trasferire ingenti quantità di dati in tempi nettamente inferiori rispetto alla trasmissione delle informazioni via Internet. Per spostare 100 TB di dati, per esempio, con una connessione alla Rete di 1 Gbit sono necessarie da 2 a 6 settimane. Con Transporter basta meno di una settimana.