Google I/O: AI generativa, nuovi servizi e device Pixel

Le novità presentate durate Google I/O abbondano: dall’AI generativa, PaLM 2, aggiornamenti di Maps e Ricerca, Duet AI e nuovi device della serie Pixel.

L’azienda ha svelato 15 prodotti che sono oggi utilizzati da oltre mezzo miliardo di persone, sei di questi sono adottati stabilmente da più due miliardi di utenti. Forti di questi numeri, i team di sviluppo perseguono la propria mission: organizzare e rendere le informazioni universalmente accessibili e utili.
In uno scenario in forte cambiamento, l’Intelligenza Artificiale guida l’evoluzione dei prodotti Google: “siamo a un punto di svolta e abbiamo l’opportunità di rendere l’Intelligenza Artificiale ancora più utile per tutti”.

Ma come?

Migliorando la conoscenza e l’apprendimento delle persone e approfondendo la loro comprensione del mondo. Stimolando la creatività e la produttività, in modo che le persone possano esprimersi e portare a termine le proprie attività. Consentendo agli sviluppatori e alle aziende di creare i propri prodotti e servizi all’avanguardia. E infine, sviluppando e implementando l’IA in modo responsabile, così che tutti ne possano beneficiare nella stessa misura.

Sundar Pichai, CEO di Google, ha illustrato le novità presenti nelle App di tutti i giorni, a partire da Gmail. Nel 2017 è stata rilasciata “Risposta Rapida”, brevi risposte che si possono selezionare semplicemente con un clic. Poi è arrivata Scrittura Intelligente, che offre suggerimenti su cosa scrivere mentre si sta digitando il testo. Scrittura Intelligente ha portato a funzionalità di scrittura più avanzate, abilitate dall’IA, che sono state usate in Workspace 180 miliardi di volte solo durante lo scorso anno. E ora, grazie a un modello generativo molto più potente, facciamo un ulteriore passo con “Help me write” in Gmail.

Digitate semplicemente il suggerimento di quello che volete – una mail per chiedere un rimborso completo – cliccate su ‘create’ e vi apparirà una bozza completa. Come potete vedere, include già anche i dettagli del volo presi dall’email precedente. Il messaggio è molto vicino a una versione da inviare, ma potreste volerlo rifinire ulteriormente perché un messaggio più elaborato potrebbe incrementare le vostre possibilità di ottenere un rimborso. “Help me write” comincerà ad essere reso disponibile con gli aggiornamenti di Workspace, ed esattamente come con Scrittura Intelligente, lo vedrete migliorare nel tempo.

Immersive View for routes in Maps

Sin dagli albori di Street View, l’IA ha combinato miliardi di immagini panoramiche in modo che le persone possano esplorare il mondo dal proprio dispositivo.

Ad I/O l’anno scorso abbiamo introdotto Immersive View, che usa l’IA per creare una rappresentazione altamente fedele di un luogo, così che ne possiate fare esperienza prima di visitarlo.
Ora, utilizziamo la stessa tecnologia per fare quello che Google Maps fa al meglio: aiutarvi ad andare dove volete andare. Google Maps fornisce ogni giorno 20 miliardi di km di direzioni: sono un sacco di viaggi. Immaginate se si potesse visualizzare l’intero viaggio prima di partire: con Immersive View for Routes ora è possibile, tanto che vogliate camminare, pedalare o guidare.

Magic Editor in Foto

Un altro prodotto migliorato dall’IA è Google Foto. Ogni mese, 1,7 miliardi di immagini vengono modificate in Google Foto e i miglioramenti dell’IA ci offrono soluzioni più potenti per farlo.

Per esempio, Magic Eraser, lanciato dapprima su Pixel, usa la fotografia computazionale abilitata dall’IA per rimuovere gli elementi indesiderati. E più avanti quest’anno, grazie a una combinazione di comprensione semantica e IA generativa sarà possibile fare ancora di più con una nuova esperienza chiamata Magic Editor.

PaLM 2 + Gemini

La capacità di rendere l’intelligenza artificiale utile per tutti si basa sul continuo progresso dei modelli di base. PaLM 2 si basa sulla nostra ricerca di base e sulla nostra infrastruttura più recente. È altamente capace di svolgere un’ampia gamma di compiti e facile da implementare. Oggi annunciamo più di 25 prodotti e funzionalità basati su PaLM 2.

I modelli PaLM 2 offrono capacità fondamentali in un’ampia gamma di dimensioni: Gecko, Otter, Bison e Unicorn. Gecko è così leggero da poter funzionare su dispositivi mobili: abbastanza veloce da consentire eccellenti applicazioni interattive sul dispositivo anche quando è offline. I modelli PaLM 2 sono più forti nella logica e nel ragionamento grazie a un’ampia formazione su argomenti scientifici e matematici. Inoltre, sono addestrati su testi multilingue (oltre 100 lingue), in modo da comprendere e generare risultati ricchi di sfumature.

Grazie a potenti capacità di coding, PaLM 2 può anche aiutare gli sviluppatori a collaborare da un paese all’altro. Vediamo un esempio. Supponiamo che stiate lavorando con un collega di Seoul e stiate eseguendo un debug del codice. Potete chiedere di risolvere un bug e aiutare il vostro collega aggiungendo commenti in coreano al codice. Il programma riconosce innanzitutto che il codice è ricorsivo, quindi suggerisce una correzione, spiega il ragionamento che sta alla base della correzione e aggiunge commenti in coreano come richiesto.

Di recente abbiamo riunito questi due team in un’unica unità, Google DeepMind. Utilizzando le risorse computazionali di Google, si stanno concentrando sulla realizzazione di sistemi più efficienti, in modo sicuro e responsabile.
Questo include il nostro modello di base di prossima generazione, Gemini, che è ancora in fase di addestramento. Gemini è stato creato da zero per essere multimodale, altamente efficiente nelle integrazioni di strumenti e API e costruito per consentire innovazioni future, come memoria e pianificazione. Anche se siamo ancora agli inizi, stiamo già vedendo capacità multimodali impressionanti, non riscontrabili nei modelli precedenti.

Responsabilità dell’intelligenza artificiale

Due approcci importanti sono il watermarking e i metadati. Il watermarking incorpora informazioni direttamente nel contenuto, in modo che si mantengano anche a seguito di un modesto editing dell’immagine. Stiamo costruendo i nostri modelli perché in futuro includano il watermarking fin dall’inizio.
I metadati consentono ai creatori di contenuti di associare un contesto aggiuntivo ai file originali, fornendo maggiori informazioni ogni volta che si incontra un’immagine. Ci assicureremo che ogni nostra immagine generata dall’intelligenza artificiale sia dotata di tali metadati. Maggiori informazioni sul nostro approccio audace e responsabile.

Aggiornamenti a Bard e Workspace

Una delle opportunità più interessanti è quella di metterli a disposizione delle persone i nostri modelli, perché possano interagirvi direttamente.

Questa è l’opportunità che abbiamo con Bard, il nostro esperimento di IA conversazionale. Stiamo rapidamente evolvendo Bard, che ora supporta un’ampia gamma di capacità di programmazione ed è diventato molto più smart nel ragionamento e nelle richieste di tipo matematico. Inoltre, da oggi gira completamente su PaLM 2. Scopri di più sugli ultimi aggiornamenti di Bard.

Labs e Search Generative Experience

Mentre l’intelligenza artificiale continua a migliorare rapidamente, siamo impegnati a fornire funzioni utili alle persone. A partire da oggi, vi offriamo un nuovo modo per provare in anteprima alcune esperienze in Workspace e in altri prodotti. Si chiama Labs. Ho detto nuovo, ma in realtà Google ha una lunga storia di utilizzo dei Labs come modo per consentire l’accesso anticipato e ottenere feedback, e potrete iniziare a iscrivervi già da oggi (negli Stati Uniti).

Oltre alle funzionalità di Workspace che avete appena visto, una delle prime esperienze che potrete testare in Labs riguarda il nostro prodotto di base, la Ricerca Google. Il motivo per cui abbiamo iniziato a investire profondamente nell’intelligenza artificiale molti anni fa è che abbiamo visto l’opportunità di migliorare la Ricerca. E grazie ai progressi di questi anni, l’abbiamo resa sempre più utile e intuitiva.

I miglioramenti nella comprensione del linguaggio ci permettono di porre domande in modo più naturale e di raggiungere i contenuti più pertinenti sul web. I progressi nella computer vision hanno introdotto nuove modalità di ricerca visiva. Ora, anche se non avete le parole per descrivere ciò che state cercando, potete cercare tutto ciò che vedete con Google Lens. E infatti Lens viene utilizzato per oltre 12 miliardi di ricerche visive ogni mese, un numero che si è quadruplicato in soli due anni. Lens, combinato con la multimodalità, ha portato alla Ricerca Multipla, che consente di effettuare ricerche utilizzando sia un’immagine sia un testo.

La Ricerca con l’IA generativa

L’intelligenza artificiale non è solo un potente fattore abilitante, ma anche un grande cambiamento a livello di piattaforma. Ogni azienda e organizzazione sta pensando a come guidare la trasformazione, ecco perché siamo impegnati a far sì che per gli altri innovare con l’IA sia facile e scalabile.
Ciò significa fornire l’infrastruttura di elaborazione più avanzata, comprese le più moderne TPU e GPU, e ampliare l’accesso ai più recenti modelli di base di Google che sono stati rigorosamente testati nei nostri prodotti. Stiamo anche lavorando per fornire strumenti efficaci in modo che i clienti possano addestrare, perfezionare ed eseguire i propri modelli, con sicurezza, protezione e privacy di livello aziendale. Ulteriori informazioni dal CEO di Google Cloud Thomas Kurian.

Nuovi dispositivi Pixel

Google introduce Pixel 7a, Pixel Fold e Pixel Tablet per un ecosistema completo di dispositivi dotati di intelligenza artificiale e progettati da Google. Pixel 7a è disponibile per l’acquisto a partire da oggi, mentre sono aperti i preordini per Pixel Fold e Pixel Tablet.

Molte funzionalità irrinunciabili sono disponibili per la prima volta su uno smartphone A-Series: lo sblocco con il volto, 8 GByte di RAM, un display a 90 Hz e la ricarica wireless. Pixel 7a offre l’autentica esperienza di Pixel, a partire da 509 euro.

Pixel 7a ha lo stesso design familiare di Pixel 7 e 7 Pro, con l’iconica Barra della fotocamera Pixel e superfici lisce ed eleganti. Potete scegliere tra quattro colori per adattarli al vostro stile: grigio antracite, bianco ghiaccio, celeste e corallo. Stiamo per lanciare anche i Pixel Buds A-Series color azzurro.
Pixel 7a include tutte le funzionalità dell’Assistenza chiamate di Pixel basate sull’AI, che rendono Pixel lo smartphone migliore per le telefonate:

Trascrivi la chiamata consente di visualizzare le opzioni del menu e di raggiungere più rapidamente il reparto giusto quando chiamate un’attività.
Filtro chiamate permette di sapere chi vi sta chiamando e perché prima di rispondere.
Aspetta per me attende in linea al vostro posto e vi avvisa non appena l’interlocutore è disponibile.
Chiamata nitida ottimizza la voce della persona con cui parlate e riduce il rumore di fondo.
Tempi di attesa stima il tempo di attesa quando chiamate un’attività.

Un sistema di fotocamere completamente aggiornato

Classificato come migliore fotocamera per smartphone per questa fascia prezzo, il sistema di fotocamere di Pixel 7a è stato completamente aggiornato. La nuova fotocamera principale dello smartphone è dotata di un sensore più grande del 72% rispetto a Pixel 6a. Inoltre, ha un nuovissimo obiettivo ultrawide da 13 Mpixel, che consente di fotografare scene più ampie. È possibile realizzare video 4K.

La funzionalità esposizione lunga consente di catturare immagini in condizioni di luce difficili. Grazie a Tensor G2, Pixel 7a include lo Zoom ad alta definizione fino a 8x, che garantisce immagini nitide e di alta qualità.