Nel campo dell’intelligenza artificiale, Google ha presentato la sua ultima innovazione: Lumiere.

Questo modello avanzato di diffusione tempo-spaziale ha la capacità di trasformare testo e immagini in video generati dall’AI, offrendo una realistica esperienza visiva con possibilità di editing in tempo reale.

Sviluppo

Lumiere rappresenta un salto qualitativo nel panorama dell’AI, consentendo agli utenti di inserire descrizioni testuali o caricare immagini statiche, per poi generare video dinamici e dettagliati. Questa tecnologia si posiziona come un’evoluzione naturale dei modelli generativi di AI, spesso paragonata a ChatGPT ma focalizzata sulla creazione e modifica di video.

Confronto con altri modelli

Sebbene esistano altri generatori di video AI come Pika e Runway, Lumiere si distingue per il suo approccio innovativo alla gestione dei dati temporali nei video. Questo modello è stato addestrato su un dataset di 30 milioni di video e relative didascalie, capace di generare 80 frame a 16 frame al secondo. Tuttavia, la fonte dei dati utilizzati per l’addestramento di Lumiere non è stata divulgata, sollevando questioni nel campo del diritto d’autore e dell’AI.

Questioni di legalità e copyright

L’esplosione dei modelli generativi di AI ha portato a numerose cause legali legate alla violazione del copyright, in particolare per l’uso presunto illecito di contenuti durante la fase di addestramento. Un caso di spicco è stato quello intentato dal New York Times contro Microsoft e OpenAI, creatori di ChatGPT, per l’uso “illegale” dei loro contenuti a scopi formativi.

Lumiere si inserisce in questo contesto come una pietra miliare, spingendo i confini della creatività assistita dall’AI. La sua capacità di generare video realistici a partire da semplici testi o immagini apre nuove strade per creatori di contenuti, designer e appassionati di tecnologia, segnando un nuovo capitolo nell’evoluzione dell’intelligenza artificiale.

Resta aggiornato, iscriviti alla Newsletter di Dopstart

×