Notebookcheck Logo

Manus AI lancia un agente AI generale in grado di gestire compiti complessi del mondo reale, compresa la creazione di videogiochi

L'agente di intelligenza artificiale generale di Manus AI affronta compiti complessi come un assistente umano. (Fonte: Manus AI)
L'agente di intelligenza artificiale generale di Manus AI affronta compiti complessi come un assistente umano. (Fonte: Manus AI)
L'agente Manus AI combina le capacità di più modelli AI in un potente assistente per il lavoro e le attività personali. La sua capacità di ricercare informazioni su Internet, di controllare i computer come un essere umano e di sintetizzare le informazioni gli permette di rispondere a richieste complesse che molti chatbot comuni non possono fare.

Manus AI ha lanciato il suo nuovo agente di intelligenza artificiale generale, in grado di ricercare in modo indipendente le risposte a richieste complesse, sfruttando più modelli linguistici di grandi dimensioni (LLM) in parallelo. L'AI è attualmente disponibile su richiedendo un invito.

I chatbot comuni, come OpenAI ChatGPT, Microsoft CoPilot e Anthropic Claude, sono addestrati su un insieme fisso di dati, quindi la loro conoscenza è limitata. Le domande senza risposte nel loro set di dati di addestramento non possono trovare risposta, anche se alcune aziende cercano di espandere i chatbot consentendo loro di accedere a Internet per ottenere le informazioni più recenti. Tuttavia, questi chatbot non possono rispondere a richieste complesse che richiedono la risoluzione di problemi.

Alcune aziende di AI hanno cercato di affrontare questo problema consentendo all'AI di pensare ai problemi passo dopo passo, analizzare i dati che trova online e sintetizzare una risposta. OpenAI Deep Research è uno di questi agenti di AI che è stato rilasciato il mese scorso, mentre Manus AI è il più recente.

A differenza dell'offerta di OpenAI, l'agente Manus utilizza più LLM AI, beneficiando così dei vantaggi che ciascuno di essi offre. I suggerimenti vengono suddivisi automaticamente in compiti più piccoli che vengono elaborati in parallelo. Gli utenti possono seguire il pensiero dell'AI, che inizia automaticamente a risolvere i problemi passo dopo passo. L'agente può produrre non solo risposte testuali, ma anche fogli di calcolo, grafici interattivi, pagine web e videogiochi.

Sebbene l'agente di Manus AI ottenga solo un punteggio del 57,7% sulle richieste di livello 3 nel benchmark GAIA AI, un test di domande del mondo reale a cui anche gli esseri umani hanno difficoltà a rispondere, l'agente AI è in grado di rispondere correttamente alle richieste più semplici di livello 1 e 2 oltre il 70% delle volte. Secondo Manus AI, si comporta meglio di altre AI in grado di ricercare risposte oggi.

L'agente Manus AI ha creato un videogioco funzionante quando gli è stato chiesto: "Puoi farmi un gioco di Super Mario ma in stile Minecraft?" (Fonte: Manus AI)
L'agente Manus AI ha creato un videogioco funzionante quando gli è stato chiesto: "Puoi farmi un gioco di Super Mario ma in stile Minecraft?" (Fonte: Manus AI)
Esempi di richieste complesse a cui l'agente Manus AI può rispondere facilmente. (Fonte: Manus AI)
Esempi di richieste complesse a cui l'agente Manus AI può rispondere facilmente. (Fonte: Manus AI)
Esempi di domande di vari livelli di difficoltà nel test di benchmark GAIA AI. (Fonte immagine: Mialon, G. et al. in "GAIA: un benchmark per gli assistenti AI generali")
Esempi di domande di vari livelli di difficoltà nel test di benchmark GAIA AI. (Fonte immagine: Mialon, G. et al. in "GAIA: un benchmark per gli assistenti AI generali")
L'agente di Manus AI risponde a domande difficili meglio di altre AI. (Fonte: Manus AI)
L'agente di Manus AI risponde a domande difficili meglio di altre AI. (Fonte: Manus AI)
Please share our article, every link counts!
Mail Logo
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2025 03 > Manus AI lancia un agente AI generale in grado di gestire compiti complessi del mondo reale, compresa la creazione di videogiochi
David Chien, 2025-03-12 (Update: 2025-03-12)