Notebookcheck Logo

Il generatore di video AI open source Pyramid Flow è ora disponibile online

Ancora da un cortometraggio da testo a video creato con Pyramid Flow (fonte immagine: Pyramid Flow su GitHub)
Ancora da un cortometraggio da testo a video creato con Pyramid Flow (fonte immagine: Pyramid Flow su GitHub)
Proveniente dalla Cina, Pyramid Flow è un modello AI open-source in grado di creare video virtuali ad alta risoluzione (768p). Secondo il team che lo ha creato, questo modello può generare un video di cinque secondi a 384p in meno di un minuto. La licenza MIT copre Pyramid Flow, che è stato sottoposto ad addestramento su insiemi di dati open-source.

Già diventato popolare nei video tutorial di YouTubepyramid Flow è un nuovo modello di AI che è stato addestrato su set di dati open-source, per un totale di circa 10 milioni di video. Frutto del lavoro di un team che riunisce ricercatori di AI dell'Università di Pechino, di Kuaishou Technology e dell'Università di Pechino delle Poste e Telecomunicazioni, Pyramid Flow è a sua volta open-source. Coperto dai termini della Licenza MIT https://en.wikipedia.org/wiki/MIT_Licenseè in grado di generare contenuti video virtuali ad alta risoluzione (768p), e ovviamente brilla quando si tratta di 384p. Secondo i suoi creatori, è in grado di generare un video di cinque secondi in meno di un minuto (utilizzando la GPU A100 in una configurazione hardware non rivelata, a quanto pare).

In alcuni scenari, Pyramid Flow eccelle. Tuttavia, quando si tratta di alcuni prompt di testo, i risultati sono tutt'altro che soddisfacenti. Come accade ancora con molte applicazioni di AI generativa, lavorare con questo strumento comporta una certa dose di casualità. Il lato positivo è che l'approccio di questo modello utilizza molta meno potenza di calcolo rispetto ai suoi concorrenti e, poiché il suo codice è open-source, può essere utilizzato in applicazioni locali o cloud da chi è interessato senza doversi preoccupare della parte relativa alle licenze.

Tuttavia, i ricercatori di AI che hanno creato Pyramid Flow hanno elencato tutti i set di dati utilizzati per l'addestramento, ma non hanno menzionato nulla sui problemi di copyright che potrebbero sorgere. Mentre alcuni creatori di contenuti sostengono che i video virtuali realizzati con materiale open-source violano i diritti dei detentori di copyright, Pyramid Flow potrebbe essere utile per mettere a punto questo tipo di contenuti senza dover coinvolgere terze parti.

Chi è interessato all'IA da una prospettiva open-source, può acquistare Open-Source AI: The Future of Data Research di J.D. TjonWolf su Amazon per 9,99 dollari (Kindle) o 12,99 dollari (brossura).

Fonte(i)

Please share our article, every link counts!
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 10 > Il generatore di video AI open source Pyramid Flow è ora disponibile online
Codrut Nistor, 2024-10-15 (Update: 2024-10-15)