Gli esseri umani possono facilmente superare l'intelligenza artificiale, secondo lo studio finanziato da Apple

Umani contro IA (Fonte immagine: generato utilizzando DALL-E 3)

Sebbene spesso forniscano risultati impressionanti, i motori di intelligenza artificiale come quelli di Meta e OpenAI, che utilizzano modelli linguistici di grandi dimensioni, mancano ancora di capacità di ragionamento di base. Un gruppo sostenuto da Apple ha proposto un nuovo benchmark, che ha già rivelato che anche i minimi cambiamenti di formulazione in una query possono portare a risposte completamente diverse.

Codrut Nistor (traduzione a cura di Ninh Duy), Pubblicato 10/14/2024 🇺🇸 🇩🇪 ...

AI Science Fail

All'inizio di questo mese, un team di sei scienziati di AI sostenuti da Apple ha pubblicato uno studio in cui ha introdotto GSM-Symbolic, un nuovo benchmark di AI che "consente valutazioni più controllabili, fornendo approfondimenti chiave e metriche più affidabili per misurare le capacità di ragionamento dei modelli" Purtroppo, sembra che gli LLM siano ancora fortemente limitati e che manchino delle capacità di ragionamento più basilari, hanno rivelato i test iniziali condotti utilizzando GSM-Symbolic con i motori AI di icone del settore come Meta e OpenAI.

Il problema dei modelli esistenti, come emerso dai suddetti test, risiede nella mancanza di affidabilità dei LLM quando vengono sottoposti a richieste simili. Lo studio ha concluso che lievi modifiche di formulazione che non altererebbero il significato di una query per un essere umano, spesso portano a risposte diverse da parte dei bot AI. La ricerca non ha evidenziato alcun modello che si distingua.

"In particolare, le prestazioni di tutti i modelli diminuiscono [anche] quando vengono modificati solo i valori numerici della domanda nel benchmark GSM-Symbolic"

ha concluso la ricerca, scoprendo anche che

"la fragilità del ragionamento matematico in questi modelli [dimostra] che le loro prestazioni peggiorano significativamente con l'aumento del numero di clausole in una domanda"

Lo studio, che conta 22 pagine, può essere consultato su qui (file PDF). Le ultime due pagine contengono problemi con l'aggiunta di alcune informazioni irrilevanti alla fine, che non dovrebbero alterare il risultato finale per un umano che lo risolve. Tuttavia, i modelli AI utilizzati hanno preso in considerazione anche queste parti, fornendo così risposte sbagliate.

In conclusione, i modelli di AI non sono ancora in grado di andare oltre il riconoscimento dei modelli e mancano ancora di capacità generalizzabili di risoluzione dei problemi. Quest'anno sono stati presentati diversi LLM, tra cui Llama 3.1 di Meta AI Nemotron-4 di Nvidia, Claude 3 di Anthropic, il giapponese Fugaku-LLM (il più grande modello mai addestrato esclusivamente sulla potenza della CPU), e Novadi Rubik's AI, una famiglia di LLM che è stata presentata all'inizio di questo mese.

Domani, O'Reilly rilascerà la prima edizione di Hands-On Large Language Models: Language Understanding and Generation, di Jay Alammar e Maarten Grootendorst. Il prezzo è di 48,99 dollari (Kindle) o 59,13 dollari (brossura).

Fonte(i)

AppleInsider

Articoli collegati

Apple M4 precede il Core Ultra 9 285K e il Ryzen 9 9950X nel benchmark Geekbench 6 Single-Core. (Fonte immagine: Apple, AMD, Intel, Unsplash, modificato)

Apple supera Intel e AMD nei guadagni cumulativi single-core e IPC dal 2016 al 2024 10/18/2024

È finalmente possibile aggiornare l'archiviazione del Mac Studio grazie a Studio Drive. (Fonte immagine: Mediamodifier - Unsplash)

Apple Gli aggiornamenti dell'archiviazione di Mac Studio sono ora disponibili attraverso la campagna Kickstarter di Studio Drive 10/16/2024

la fotocamera teleobiettivo di iPhone 16 Pro Max viene ritestata da DxOMark (Fonte: Apple)

l'iPhone 16 Pro Max si colloca dietro i flagship cinesi Android nel nuovo test della fotocamera di DxOMark 10/15/2024

È stato annunciato un nuovo iPad Mini Apple (fonte: Apple)

Apple annuncia in modo furbo una nuova variante dell'iPad Mini con un A17 Pro e un aggiornamento dello storage 10/15/2024

Appleil prossimo auricolare VR di Vision Pro dovrebbe ancora mancare della famigerata funzionalità EyeSight. (Fonte: Roméo A)

Apple l'analista discute lo stato dei piani di Apple per le cuffie Vision VR, mentre si vocifera anche di occhiali intelligenti e AirPods con fotocamere 10/15/2024

Apple si prevede che offrirà il MacBook Pro con almeno 16 GB di RAM per il suo aggiornamento M4. (Fonte immagine: Romancev768)

Apple l'analista emette il verdetto sul presunto MacBook Pro con i leak di Apple M4 10/14/2024

Il Galaxy S25 FE potrebbe essere l'alternativa più sottile di Samsung al Apple iPhone 17 Air. (Fonte immagine: Samsung)

Samsung Galaxy S25 FE: un modello ridotto per competere con l'iPhone 17 Air di Apple 10/13/2024

Apple annuncia la Swift Student Challenge 2025 per gli studenti programmatori, che potranno mostrare la loro ingegnosità nelle app per vincere i premi di Apple. (Fonte immagine: Apple)

Apple annuncia la Swift Student Challenge 2025 per gli studenti programmatori che possono mostrare la loro ingegnosità nelle app e vincere i premi di Apple 10/10/2024

Il MacBook Pro ha avuto meno acquirenti nel terzo trimestre del 2024 rispetto all'anno precedente. (Fonte: Notebookcheck)

Mercato dei PC: Apple è il grande perdente del terzo trimestre, mentre Asus e Lenovo aumentano la loro quota di mercato 10/09/2024

Pininfarina ha contribuito al design dei SUV elettrici Model B/C (Fonte: Foxconn/X)

Rumored Apple Il produttore di auto Foxconn rivela la Model C in arrivo negli Stati Uniti per sfidare la Tesla Model Y Juniper 10/09/2024

Steam Deck per ottenere un facile a...

Un importante leaker condivide un v...

Editor of the original article: Codrut Nistor - Senior Tech Writer - 6683 articles published on Notebookcheck since 2013

contact me via: @online_digi, online.digital.craft, LinkedIn

Translator: Ninh Ngoc Duy - Editorial Assistant - 566423 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 10 > Gli esseri umani possono facilmente superare l'intelligenza artificiale, secondo lo studio finanziato da Apple

Codrut Nistor, 2024-10-14 (Update: 2024-10-14)