Air Head creators say OpenAI's Sora finicky to work with, needs hundreds of prompts, serious VFX work for under 2 minutes of cohesive story ^↺

Shy Kids ha realizzato Air Head in collaborazione con il modello di generazione video Sora di OpenAI. (Fonte: Shy Kids su YouTube)

OpenAI ha recentemente mostrato un impressionante demo reel creato dalla casa di produzione Shy Kids utilizzando il suo generatore video Sora. Come si è scoperto, Shy Kids ha impiegato un'incredibile quantità di lavoro nella post-produzione di Air Head, nonostante OpenAI abbia affermato che Sora rende la produzione di video senza sforzo.

Julian van der Merwe (traduzione a cura di Ninh Duy), Pubblicato 04/27/2024 🇺🇸 🇫🇷 ...

AI Fail Software

Quando OpenAI ha annunciato Sora, la sua AI generatrice di video, uno dei video utilizzati per dimostrare le sue capacità è il cortometraggio di Shy Kids intitolato Air Head. Sebbene il video sia stato inizialmente pubblicizzato come un impressionante show reel per il modello OpenAI, una recente intervista di FX Guide con Shy Kids rivela che il video ha richiesto molto più lavoro di quanto molti pensassero.

Sebbene ciò che Sora è in grado di fare sia certamente impressionante e quasi impossibile da realizzare solo un anno o due fa, il team di Shy Kids ha comunque impiegato quasi due settimane per creare Air Head, soprattutto a causa dei limiti dell'IA. Uno dei maggiori ostacoli che Shy Kids ha incontrato con Sora è stata la sua mancanza di coesione, che ha costretto il team di produzione a utilizzare un metodo di montaggio poco ortodosso, non diverso dalla creazione di un film o di un documentario di found footage.

Si trattava di ottenere un sacco di inquadrature e cercare di tagliarle in modo interessante per la VO. - Patrick Cederberg, post-produzione su Air Head

Shy Kids afferma di avere un copione per il video, ma il team ha dovuto essere fluido e adattarsi ai vari output generati da Sora. Shy Kids ha anche avuto difficoltà a mantenere le cose coerenti da una ripresa all'altra, con Sora che spesso generava un tipo diverso di testa sul palloncino. Complessivamente, Cederberg afferma che ci sono volute "centinaia di generazioni" per ottenere poco meno di un minuto e mezzo di riprese montate per il video. Stima inoltre che il rapporto tra materiale di partenza e contenuto finale sia stato di 300:1, il che significa che Shy Kids ha utilizzato solo lo 0,33% circa del video generato da Sora nel montaggio finale.

I miei calcoli non sono buoni, ma credo che il rapporto tra il materiale di partenza e il contenuto finale sia di circa 300:1.

Lavorare con Sora non significava solo generare centinaia di clip, però. Il team ha dovuto anche intervenire manualmente ed eseguire tutte le attività regolari come il color grading, il retiming e persino i VFX per rimuovere gli elementi indesiderati dall'inquadratura. In una clip generata, Sora ha prodotto un palloncino con un volto impresso sulla parte anteriore, e in altre, il palloncino era di colori diversi o aveva un filo indesiderato che pendeva dalla parte inferiore - tutti elementi che dovevano essere rimossi.

Applicazioni più avanzate di VFX hanno visto il team di Shy Kids rimuovere un'intera testa che era stata generata su Sonny, il personaggio principale, al posto del palloncino. Cose del genere sono state rimosse in Adobe After Effects(che costa 34,99 dollari al mese ed è disponibile su Amazon) per arrivare al prodotto finale.

Sebbene Sora e l'AI video generativa abbiano fatto molta strada, sembra che siano ben lontani dal sostituire gli artisti dietro le quinte, soprattutto se il contenuto prodotto è destinato ad essere coerente o a durare più di qualche secondo. Questo probabilmente spiega anche perché, ad eccezione di due, tutte le clip 'inedite' che OpenAI ha pubblicato sulla sua pagina Sora sono tutte dell'ordine di 20 secondi o meno.

▶ load Youtube video

Fonte(i)

Guida FX Bambini timidi su YouTube, OpenAI

Articoli collegati

Sistema AI sicuro (Fonte immagine: generato utilizzando DALL-E 3)

L'ex scienziato capo di OpenAI raccoglie 1 miliardo di dollari per lo sviluppo di sistemi di AI sicuri 09/05/2024

Anche il rilevamento delle impronte digitali di OpenAI si dice che sia accurato al 99,9% (Fonte: OpenAI [modificato])

Insider riferisce che il potente strumento antiplagio di OpenAI per ChatGPT è in fase di stallo a causa di dibattiti interni 08/06/2024

Il prototipo SearchGPT sostiene di fornire fonti pertinenti per tutti i risultati di ricerca. (Fonte: OpenAI)

Il prototipo 'SearchGPT' di OpenAI entra in fase di test limitato, portando l'intelligenza artificiale conversazionale e l'attribuzione della fonte nelle ricerche 07/26/2024

OpenAI ha lanciato una versione più economica del suo GPT-4o LLM più potente, GPT-4o mini. (Fonte immagine: generato da AI, Dall-E 3)

OpenAI presenta GPT-4o mini con un prezzo 25 volte inferiore a GPT-4o, consentendo a un maggior numero di aziende e utenti di accedere all'AI di qualità 07/19/2024

ChatGPT su Mac ha dei problemi. (Fonte: OpenAI)

L'app OpenAI per macOS si aggiorna in risposta al fiasco delle chat non crittografate 07/07/2024

Di recente è stata pubblicata la più grande raccolta di password di sempre. (Immagine via coolist.com)

Quasi 10 miliardi di password sono trapelate nella più grande raccolta di password di sempre 07/07/2024

OpenAI lancia GPT-4o con funzionalità audio, immagini e testo migliorate. (Fonte: OpenAI su YouTube)

OpenAI lancia un'intelligenza artificiale GPT-4o più veloce e migliorata, con la possibilità di chattare utilizzando audio, immagini e testo 05/14/2024

Il CEO di YouTube dice che i termini di servizio della piattaforma devono essere rispettati (Fonte: OpenAI)

YouTube avverte OpenAI di non utilizzare i suoi video per addestrare i modelli 04/06/2024

OpenAI dimostra le capacità di Voice Engine che può clonare la voce di una persona con un campione di 15 secondi. (Immagine AI Dall-E 3)

OpenAI mostra in anteprima la capacità di Voice Engine di clonare in modo convincente la voce di una persona con un campione vocale di 15 secondi 03/30/2024

Gli utenti gratuiti di Microsoft Copilot hanno ora accesso all'avanzato GPT-4 Turbo (Fonte: Microsoft)

Microsoft Copilot offre ora il GPT-4 Turbo di OpenAI gratuitamente 03/15/2024

La xAI di Elon Musk sembra sfidare la dichiarazione di missione originale di OpenAI nella sua ultima mossa di diventare open-source. (Fonte immagine: xAI / OpenAI - modificato)

Grok AI diventa open-source, l'ultima mossa di Elon Musk nella disputa tra xAI e OpenAI 03/12/2024

Discriminazione nella valutazione e selezione del lavoro da parte di GPT-3 e GPT-4 di OpenAI (immagine simbolica: DALL-E / AI, a cura)

Reclutamento basato sull'AI: L'esperimento smaschera il razzismo del GPT di OpenAI 03/10/2024

OpenAI raggiunge una valutazione di 80 miliardi di dollari mentre il CEO Altman si prepara alla produzione di chip AI 02/17/2024

OpenAI presenta Sora, che offre una generazione fotorealistica di testi e video (Fonte: OpenAI)

OpenAI rivela Sora, un modello di AI in grado di generare video fotorealistici a partire da suggerimenti testuali 02/16/2024

I guasti alle batterie degli EV son...

Garmin rilascia un nuovo aggiorname...

Editor of the original article: Julian van der Merwe - Senior News Writer - 1105 articles published on Notebookcheck since 2022

contact me via: @NGC_1275, julian_vandermerwe, LinkedIn

Translator: Ninh Ngoc Duy - Editorial Assistant - 522633 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 04 > Sora di OpenAI è difficile da lavorare, ha bisogno di centinaia di suggerimenti e di un serio lavoro di VFX per meno di 2 minuti di storia coesa

Julian van der Merwe, 2024-04-27 (Update: 2024-08-15)