Notebookcheck Logo

Il fotografo evidenzia il campo minato del copyright dell'intelligenza artificiale generativa, creando copie convincenti delle "foto più iconiche di tutti i tempi"

Sembra che, anche senza richieste dirette, i generatori di immagini AI siano in grado di ricreare foto classiche, come il pranzo in cima a un grattacielo. (Fonte immagine: Pubblico dominio / DALL-E via PetaPixel)
Sembra che, anche senza richieste dirette, i generatori di immagini AI siano in grado di ricreare foto classiche, come il pranzo in cima a un grattacielo. (Fonte immagine: Pubblico dominio / DALL-E via PetaPixel)
Un fotografo è partito con l'obiettivo di ricreare alcune delle immagini più riconoscibili di tutti i tempi utilizzando Midjourney e DALL-E. Con una sorpresa per nessuno, i sistemi AI sono stati in grado di ricreare in modo sorprendentemente accurato ciascuna delle immagini, che includevano la Ragazza afgana e il trionfo di Muhammad Ali su Sonny Liston.

Da quando i sistemi di intelligenza artificiale generativa, come Midjourney e DALL-E, sono esplosi in popolarità verso l'inizio e la metà del 2022, non sono mancati gli artisti in armi artisti in armi contro i sistemi contro i sistemi per violazione del copyright. È naturale che ci sia una certa resistenza, dal momento che i sistemi di intelligenza artificiale sono in gran parte addestrati su immagini protette da copyright per le quali non è stata ottenuta alcuna licenza.

Un fotografo, Matt Growcoot, di PetaPixel, si è messo alla ricerca di quanto fosse facile far sì che due potenti AI di generazione di immagini - Midjourney e DALL-E - ricreassero alcune delle immagini più iconiche e riconoscibili della storia. Come si è scoperto, non è stato affatto difficile.

L'elenco delle fotografie che le IA dovevano ricreare era il seguente: Il V-J Day a Times Square di Alfred Eisenstaedt, la foto di copertina di Abbey Road dei Beatles, Madre Migrante di Dorothea Lange, Pranzo in cima a un grattacielo (autore sconosciuto), I Tetons e il fiume Snake di Ansel Adams, la Ragazza Afgana di Steve McCurry, Alzando la bandiera su Iwo Jima di Joe Rosenthal, Dietro la Gare Saint-Lazare di Henri Cartier-Bresson, La vittoria di Muhammad Ali su Sonny Liston di John Rooney, Earthrise di William Anders e la foto di Don McCullin di un marine statunitense colpito da una granata durante la guerra del Vietnam.

Sebbene i sistemi AI non abbiano prodotto copie esatte delle immagini in questione, i risultati (che può vedere nel post di Growcoot su PetaPixel o scorrendo verso il basso fino al post incorporato di X, ex Twitter) sono molto simili in molti casi. L'immagine che si è rivelata più difficile da ricreare sia per Midjourney che per DALL-E è stata Behind the Gare Saint-Lazare di Cartier-Bresson, mentre l'estetica e il tono di immagini come la Ragazza afgana e la vittoria di Ali su Liston erano sorprendentemente simili all'originale, anche se non erano repliche esatte.

Il paesaggio di Adams era probabilmente il più simile in termini di ricreazione esatta, mentre Madre Migrante, Abbey Road, V-J Day a Times Square e Pranzo in cima a un grattacielo erano tutti molto simili alle loro controparti create dall'uomo.

Queste rappresentazioni accurate delle foto originali sono state eseguite nonostante i suggerimenti abbastanza dettagliati, ma non specifici, come "Crea un'immagine fotorealistica in bianco e nero del 1945 di un marinaio che bacia una ragazza vestita di bianco mentre festeggiano a Times Square, New York" e "Crea una foto drammatica in bianco e nero scattata nel 1942 del Parco Nazionale Grand Teton nel Wyoming. Il fiume Snake è in primo piano con le montagne sullo sfondo"

È anche interessante vedere che, sebbene le ricreazioni di immagini fossero tutte abbastanza rappresentative delle opere d'arte originali, ogni algoritmo di IA generativa ha comunque un aspetto proprio. Le immagini di Midjourney erano sempre più realistiche, mentre le immagini di DALL-E avevano tutte il tipo di foschia morbida che ci aspettiamo dall'AI generativa, come se le immagini fossero state scattate con qualcosa come un filtro di diffusione (che si può trovare su Amazon a soli 10,49 dollari) o un obiettivo con gelatina di petrolio spalmata sulla parte anteriore.

Il successo di questo esperimento non solo evidenzia l'importanza di sforzi come le Content Credentials di Leica, ma solleva ancora una volta seri interrogativi sul futuro ruolo della fotografia negli sforzi documentaristici e giornalistici.

Se è interessato a percorrere la strada più lunga per creare immagini artistiche, dia un'occhiata alla Fujifilm X-S20 su Amazon (attualmente 1.151 dollari)

Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 03 > Il fotografo evidenzia il campo minato del copyright dell'intelligenza artificiale generativa, creando copie convincenti delle "foto più iconiche di tutti i tempi"
Julian van der Merwe, 2024-03- 8 (Update: 2024-03- 8)