Google ha recentemente annunciato una serie di aggiornamenti al suo modello Gemini AI, inclusi diversi aggiornamenti e nuovi modelli. Tra questi, uno che ha attirato molta attenzione è stato Gemini Live, un modello di intelligenza artificiale multimodale con funzionalità video e vocali.
Da quando Bard è stato rinominato Gemini a febbraio, il modello AI ha sostituito Google Assistant sui dispositivi Android. Tuttavia, ciò che può fare attualmente è piuttosto limitato. Con Gemini Live, Google mira a cambiare questa situazione offrendo un modello di intelligenza artificiale più potente e versatile.
Cos’è Gemini Live?
Per fornire agli utenti un’esperienza IA migliorata e per affrontare il ChatGPT potenziato GPT-4o di OpenAI, Google ha recentemente annunciato Gemini Live alla sua I/O Developer Conference. Gemini Live consentirà agli utenti di avere conversazioni naturali e personalizzate in tempo reale con esso tramite voce e, successivamente, video.
Il nuovo modello di intelligenza artificiale fa parte del progetto Astra di Google, che è il tentativo del colosso della ricerca di costruire un assistente AI universale in grado di utilizzare diversi tipi di input della vita quotidiana per fornire assistenza. Ad esempio, Gemini Live può utilizzare testo, immagini dalla fotocamera dello smartphone e la tua voce per rispondere alle domande.
Secondo Google, il nuovo modello del linguaggio naturale non solo aiuterà gli utenti a risolvere problemi ed eseguire varie azioni, ma anche a sentirsi completamente naturali durante le interazioni. Gli utenti potranno avviare Gemini Live toccando l’icona della voce sul proprio telefono, che visualizzerà l’intelligenza artificiale a schermo intero con un effetto di forma d’onda audio.
Potrai quindi conversare con l’IA proprio come faresti con un vero assistente personale. Un eccellente esempio di come il modello di intelligenza artificiale aggiornato può aiutarti è quando gli chiedi di aiutarti con la preparazione a un colloquio. Gemini Live suggerirà le competenze che puoi evidenziare, fornirà suggerimenti per parlare in pubblico e altro ancora.
Caratteristiche
Gemini Live è dotato di alcune funzionalità che lo rendono un assistente AI molto migliore di Google Assistant, Siri di Apple o Alexa di Amazon.
Conversazioni vocali bidirezionali
Gemini Live ti consente di conversare con esso e fornisce risposte verbali simili a quelle umane, dando vita a conversazioni coinvolgenti e intuitive. Ad esempio, puoi chiedergli informazioni sul tempo e ti fornirà un aggiornamento accurato e conciso.
Funzionalità dell’assistente intelligente
Il modello AI può fungere da assistente intelligente ed eseguire attività come il riepilogo delle informazioni dalle e-mail e l’aggiornamento del calendario. Ad esempio, puoi scattare una foto del volantino di un concerto e Gemini aggiungerà l’evento al tuo calendario.
Capacità visive
Utilizzando la fotocamera del tuo smartphone, Gemini Live può acquisire video in tempo reale. Ciò gli consente di identificare gli oggetti e rispondere a domande su di essi. Ad esempio, se punti la fotocamera del tuo smartphone verso un altoparlante e chiedi a Gemini di identificarlo, ti dirà di cosa si tratta e ne identificherà anche la marca e il modello.
Come funziona Gemini Live?
Project Astra può combinare input vocali e visivi rendendoli facili da comprendere per il modello AI. Può quindi reagire alle informazioni e fornire l’assistenza necessaria. Come ChatGPT basato su GPT-4o di OpenAI, Gemini Live è un’intelligenza artificiale multimodale e non si basa esclusivamente sul testo come input.
Sebbene Gemini Live utilizzerà originariamente l’input vocale per raccogliere e analizzare i dati nella versione iniziale, verrà aggiornato nei prossimi mesi per elaborare e analizzare anche i video suddividendoli fotogramma per fotogramma per una migliore comprensione e interazione.
L’intelligenza artificiale può adattarsi alla velocità con cui parlano i diversi utenti e puoi persino interromperla per chiedere chiarimenti o fornire maggiori informazioni. La sua capacità di imitare il dialogo umano può fornire un’interazione più coinvolgente. Pertanto, puoi avere una conversazione avanti e indietro con lui, proprio come con un assistente umano. Inoltre, potrai scegliere tra dieci diverse voci per l’IA.
GPT-4o contro. Gemelli in diretta
Sebbene sia GPT-4o che Gemini Live siano modelli IA multimodali, al momento è difficile vedere quale dei due funzioni meglio nella vita reale, soprattutto perché nessuno dei due è al momento disponibile pubblicamente.
Tuttavia, a differenza di ChatGPT, Gemini Live si affida ad altri modelli di intelligenza artificiale come Google Veo e Imagen 3, per fornire output sotto forma di video e immagini. Nonostante ciò, nelle demo mostrate da OpenAI e Google, ChatGPT sembrava più naturale e il nuovo modello GPT-4o riusciva addirittura a rilevare e simulare le emozioni umane attraverso i toni vocali.
Inoltre, può adattarsi al modo in cui desideri che risponda, cosa che Gemini Live non può fare, almeno nel suo stato attuale.
Gemelli Disponibilità in tempo reale
Gemini Live sarà disponibile per gli abbonati Gemini Advanced, che è la versione a pagamento del chatbot AI. Verrà lanciato nei prossimi mesi e si prevede che sarà ampiamente disponibile entro la fine dell’anno.
App come Google Messaggi potranno sfruttare appieno Gemini Live, consentendo agli utenti di interagire con l’intelligenza artificiale direttamente all’interno dell’app di messaggistica.
Gemini Live potrebbe essere il prossimo importante aggiornamento del chatbot AI di Google, ed è proprio ciò di cui ha bisogno per affrontare rivali come ChatGPT di OpenAI. Con funzionalità multimodali e potenti capacità vocali, il modello aggiornato può aiutare Google a raggiungere il successo nella fornitura di un assistente digitale versatile e affidabile.
Al momento Google ha solo annunciato che porterà il nuovo modello AI agli abbonati a pagamento. Anche se questo esclude gli utenti gratuiti, che costituiscono una parte enorme della base utenti di Google, speriamo che Google cambi la sua posizione e decida di espandere la disponibilità di Gemini Live.
Lascia un commento