xAI lancia Grok 3 AI con prestazioni da primato e modelli di ragionamento in versione beta

xAI lancia la famiglia Grok 3 di AI all'avanguardia. (Fonte: xAI)

I più recenti modelli linguistici di grandi dimensioni xAI hanno superato le classifiche dei benchmark grazie alla loro capacità di cercare informazioni su Internet, ragionare su problemi complessi ed elaborare input con una finestra di contesto di un milione di token. I modelli Grok 3 hanno battuto OpenAI GPT-4o e DeepSeek-V3 sulla maggior parte dei benchmark.

David Chien (traduzione a cura di Ninh Duy), Pubblicato 02/21/2025 🇺🇸 🇩🇪 ...

AI Software Launch

La xAI di Elon Musk ha lanciato la famiglia Grok 3 di modelli linguistici di grandi dimensioni AI all'avanguardia, che generalmente superano le altre AI nei benchmark AI standardizzati.

I modelli Grok 3 sono stati addestrati sul cluster di supercomputer Colossus dell'azienda, che utilizza 100.000 GPU Nvidia Hopper Tensor Core. Sono stati rilasciati una coppia di modelli standard e mini non ragionanti (Grok 3 beta e Grok 3 mini beta) e una coppia di modelli ragionanti (Grok 3 beta (Think) e Grok 3 mini beta (Think)).

I modelli non ragionanti in genere superano le precedenti AI in cima alle classifiche, come OpenAI GPT-4o e DeepSeek-V3. Uno dei motivi è che dispongono di una finestra di contesto da un milione di token, che consente all'AI di utilizzare quantità molto elevate di testo. Questo migliora la capacità dei modelli di sintetizzare la risposta corretta da una varietà di fonti. Detto questo, i modelli di Grok 3 beta rispondono ancora a domande di ricerca di fatti con un'accuratezza inferiore al 50% (benchmark SimpleQA), quindi gli umani avranno ancora un lavoro domani.

I modelli di ragionamento elaborano richieste complesse passo dopo passo, consentendo all'utente di vedere il processo di pensiero dell'AI. Ciò consente a queste AI di risolvere i problemi come farebbe un esperto, risolvendo parti più piccole del problema e combinando i risultati per ottenere una risposta adeguata. Selezionando l'agente DeepSearch, o opzione di ricerca, Grok 3 effettuerà una ricerca ampia e profonda in Internet e utilizzerà degli interpreti di codice prima di generare dei rapporti che riassumono le sue scoperte. I modelli Grok 3 (Think) sono generalmente i migliori nel risolvere problemi matematici, nel rispondere a domande a scelta multipla di livello universitario e nel completare compiti di codifica rispetto ad altre IA.

xAI prevede di continuare a mettere a punto Grok 3 per migliorare le prestazioni nei prossimi mesi su un cluster di supercomputer da 200.000 GPU. Grok 3 è ora disponibile per tutti gli utenti su X e Grok.com. Gli utenti gratuiti potrebbero incontrare dei limiti di utilizzo, mentre gli utenti a pagamento avranno accesso alle funzioni avanzate.