Matt Brittin, Presidente di Google EMEAha condiviso gli annunci che ha più apprezzato dell’I/O, evento più importante dell’anno per il motore di ricerca:
✏️ Introduzione di Ask Photos
Ask Photos aiuta a cercare i vostri ricordi in modo più semplice. Per esempio sarà facile mettere insieme i momenti più importanti della crescita di un bambino con semplici domande del tipo: “Quando ha imparato a nuotare?”.
“Gemini va oltre la semplice ricerca, riconoscendo i diversi contesti, dalle vasche in piscina allo snorkeling in mare – precisa Brittin su LinkedIn – e Photos raccoglie il tutto in un riepilogo”.
Trovare e-mail
Gemini è ora in grado d riassumere tutte le e-mail recenti di un mittente specifico. Ad esempio, se emerge la necessità di raccogliere tutte le e-mail di un capo o di un collega su un progetto, con Gemini in Workspace sarà facile identificare quelle pertinenti, compresi gli allegati come i PDF, e avere un riepilogo dei punti chiave e delle cose da fare.
Nuova esperienze con Gemini intelligenti
L’interazione con Gemini diventa più colloquiale e intuitiva e permette di avere una conversazione vocale approfondita.
️Generazione di video con Veo
“Dedicato ai creativi, questo è il nostro modello di generazione video più capace – spiega Brittin -. Grazie a una comprensione avanzata del linguaggio naturale e della semantica visiva, genera video che rappresentano fedelmente la visione creativa dell’utente, catturando con precisione il tono di un messaggio e rendendo i dettagli dei messaggi più lunghi. Comprende anche termini cinematografici come timelapse o riprese aeree di un paesaggio, per produrre filmati coerenti e omogenei”.
⚡ Gemini 1.5 Flash
“Abbiamo introdotto il modello più recente e veloce della famiglia Gemini – scrive Brittin-. È ottimizzato per le attività in cui la bassa latenza e il costo sono più importanti. Con Gemini 1.5 abbiamo creato la finestra di contesto più lunga di qualsiasi altro modello di fondazione su larga scala. Le finestre di contesto sono importanti perché aiutano i modelli di intelligenza artificiale a richiamare le informazioni durante una sessione: più lunga è la finestra di contesto, maggiore è la quantità di testo, immagini, audio, codice o video che il modello può assimilare ed elaborare. Siamo passati da un modello in grado di elaborare 32.000 token in una sola volta a una versione in grado di elaborare 1 milione di token (e ora 2 milioni di token per 1,5 Pro!)”.
per leggere di più: I/O nel blog
La versione originale del testo su LinkedIn Post by Matt