Il lancio di Sora di OpenAI ha aperto le porte alle app di generazione video basate sull’intelligenza artificiale in grado di creare brevi clip da istruzioni di testo. Ora, anche Google si è buttata nella mischia annunciando la propria app AI per la generazione di video, Veo, alla conferenza annuale degli sviluppatori I/O di questa settimana.
Tuttavia, proprio come molti altri strumenti di intelligenza artificiale appena annunciati, il nuovo generatore video non è ancora disponibile per l’uso pubblico. Google ha in programma di consentire ad artisti e creatori di provare lo strumento attraverso esercizi di crowdsourcing, che possono aiutare a migliorarlo. Ecco cos’altro abbiamo imparato su Google Veo.
Cosa può fare Veo?
Google Veo può generare video 1080p che durano più di un minuto e puoi anche modificarli tramite istruzioni scritte. Può garantire che i fotogrammi siano visivamente coerenti e gli utenti possano utilizzare un singolo prompt o una serie di prompt per creare una narrazione. Lo strumento può includere effetti cinematografici come riprese aeree e creare scene altamente dettagliate.
Puoi optare per realismo, surrealismo e persino animazione quando crei video utilizzando Veo. Oltre a ciò, ti consente di utilizzare comandi di produzione cinematografica e comprende termini come “ripresa aerea” e “timelapse”. Rispetto ai precedenti generatori di video AI annunciati da Google, Veo offre un maggiore controllo fornendo video di migliore qualità.
Veo supporta anche il Masked Editing, che ti consente di apportare modifiche a sezioni specifiche del video. Puoi farlo includendo un’area di maschera nel prompt e le immagini possono anche essere utilizzate insieme ai prompt di testo per generare video.
In tal caso, utilizzerà l’immagine fornita come riferimento e genererà un video nello stesso stile, come il seguente video generato utilizzando un’immagine di alpaca che indossano maglioni lavorati a maglia e il messaggio Alpacas dancing to the beat
.
Come funziona Veo?
I modelli di intelligenza artificiale video devono comprendere correttamente la richiesta che viene loro fornita e combinare tali informazioni con i riferimenti disponibili. Veo è stato progettato per essere eccezionalmente bravo a comprendere il linguaggio naturale e le immagini, il che gli consente di generare video in modo accurato, compresi quelli con numerosi dettagli.
Per questo motivo, un messaggio come Timelapse of a common sunflower opening, dark background
può fornirti un video di altissima qualità.
Secondo Google, Veo migliora altri strumenti di generazione video annunciati in precedenza dall’azienda, come Lumiere, VideoPoet, WALT, ecc., utilizzando utilizzi video compressi latenti. A differenza di questi strumenti, Veo è addestrato su didascalie video dettagliate, che aiutano l’intelligenza artificiale a comprendere meglio le istruzioni.
Google afferma che il generatore video si basa su trasformatori di diffusione latenti, che garantiscono coerenza e impediscono ai personaggi e agli oggetti di sfarfallare e saltare da una scena all’altra. Utilizza anche i latenti, che sono rappresentazioni compresse di video che lo rendono più efficiente e aiutano a migliorare le prestazioni. Grazie a ciò, Veo può generare video di alta qualità in meno tempo.
I video generati utilizzando Veo verranno contrassegnati con filigrana utilizzando il SynthID di Google, che utilizza per identificare i contenuti generati dall’intelligenza artificiale, in modo simile a ciò che fa Sora di OpenAI attraverso lo standard Coalition for Content Provenance and Authenticity (C2PA).
Inoltre, esistono processi di controllo della memorizzazione e filtri di sicurezza per contribuire a ridurre i rischi di pregiudizio, copyright e privacy. Nonostante queste tecnologie e processi, Veo necessita ancora di qualche miglioramento, poiché gli sfondi tendono ancora a spostarsi e le aree altamente dettagliate non sembrano messe insieme molto bene. Ecco perché Google consente solo a pochi creatori di testarlo.
Come puoi usare Veo?
Come accennato in precedenza, Veo non è attualmente disponibile per l’uso pubblico e Google consente solo a pochi creatori selezionati di provare lo strumento. Possono provarlo utilizzando VideoFX, un altro strumento sperimentale disponibile in Google Labs, dove sono presenti tutti i prodotti Google in fase di test.
Se sei un creatore e vuoi provare Veo,
- Visita il sito web di Google Labs per iscriverti alla lista d’attesa.
- Inserisci i tuoi dati e inviali.
- Attendi che Google controlli il tuo invio. Se lo ritiene adatto, ti sarà permesso di provare Veo.
Google Veo è l’ultimo di una lunga serie di generatori video basati sull’intelligenza artificiale annunciati da Google e sembra essere il più potente finora. Non solo ti consente di creare video utilizzando stili ed effetti diversi, ma anche di modificare facilmente i video creati.
Abbiamo spiegato come i creatori possono unirsi alla lista d’attesa e provare lo strumento da soli, ma non si sa se Veo sarà lanciato pubblicamente. Google ha solo accennato al fatto che alcune delle funzionalità dello strumento potrebbero essere incluse nei cortometraggi di YouTube, quindi c’è qualcosa da aspettarsi.
Lascia un commento