Notebookcheck Logo

IBM lancia i modelli di intelligenza artificiale open-source Granite 3.0 per le aziende

I modelli di AI open-source IBM Granite 3.0 per le aziende sono ora disponibili (Fonte: IBM)
I modelli di AI open-source IBM Granite 3.0 per le aziende sono ora disponibili (Fonte: IBM)
Coperta dai termini della licenza Apache 2.0, la famiglia di modelli di intelligenza artificiale IBM Granite 3.0 si rivolge ai clienti aziendali e offre prestazioni di alto livello insieme alla (presunta) serie più completa di funzionalità di rilevamento dei rischi e dei danni sul mercato. Gli interessati possono scaricare i modelli da Hugging Face.

All'inizio di oggi, IBM ha presentato la sua famiglia di modelli di AI più avanzati fino ad oggi, portando il numero di versione di Granite a 3.0. Nel settembre 2023, IBM ha presentato i modelli di fondazione Granitee ora sta passando la famiglia ad un modello open-source, migliorando allo stesso tempo ogni altro aspetto. Tutti i modelli Granite 3.0 (di cui parleremo più avanti) sono coperti dai termini della licenza Apache 2.0, che consente sia ai clienti aziendali che alla comunità in generale di trarne vantaggio.

I tre rami di Granite 3.0 e i membri di ciascuno sono questi:

  • Uso generale/Linguaggio: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • Guardrail e sicurezza: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • Miscela di esperti: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

A differenza dei loro concorrenti, che vengono addestrati su dati pubblici, i modelli Granite di IBM utilizzano dati aziendali e possono essere facilmente integrati in vari flussi di lavoro e ambienti aziendali, riducendo i costi fino a 23 volte rispetto ai grandi modelli di frontiera. Secondo IBM, l'addestramento di questi nuovi modelli ha coinvolto oltre 12 trilioni di token su dati tratti da 12 diversi linguaggi naturali e 116 diversi linguaggi di programmazione.

Uno dei punti salienti della famiglia è Guardian 3.0, che viene fornito con il rilevamento dei rischi e dei danni leader del mercato, tenendo conto della fondatezza, della rilevanza del contesto e della rilevanza della risposta, oltre agli attributi già comuni come pregiudizi sociali, odio, tossicità, profanità, violenza, jailbreak e così via.

Coloro che vogliono iniziare con Granite 3.0 di IBM (o passare ai nuovi pezzi di codice) possono andare su Hugging Face e prenderli. Mentre una selezione di modelli sarà disponibile per i microservizi NIM di Nvidia e per le integrazioni di Google Cloud Vertex AI Model Garden con Hugging Face, le varianti istruttive dei nuovi modelli linguistici Granite 3.0 8B e 2B e i modelli Granite Guardian 3.0 8B e 2B sono disponibili per l'uso commerciale tramite la piattaforma IBM watsonx piattaforma.

Alla fine di agosto, Clifford A. Pickover ha pubblicato Intelligenza Artificiale: Una storia illustrata: From Medieval Robots to Neural Networks, un libro che è ora disponibile a 8,99 dollari in formato Kindle e a 17,26 dollari in versione paperback.

Fonte(i)

IBM presenta Granite 3.0: Modelli di intelligenza artificiale ad alte prestazioni costruiti per le aziende

- I nuovi modelli Granite 3.0 8B e 2B, rilasciati con licenza permissiva Apache 2.0, mostrano prestazioni elevate in molti benchmark accademici e aziendali, in grado di superare o eguagliare modelli di dimensioni simili

- I nuovi modelli Granite Guardian 3.0 offrono le funzionalità di guardrail più complete di IBM per far progredire l'IA sicura e affidabile

- I nuovi modelli Mixture-of-Experts di Granite 3.0 consentono un'inferenza estremamente efficiente e una bassa latenza, adatta alle implementazioni basate su CPU e all'edge computing

- Il nuovo modello Granite Time Series ha raggiunto prestazioni all'avanguardia nella previsione a zero/pochi scatti, superando modelli 10 volte più grandi

- IBM presenta la prossima generazione di watsonx Code Assistant, alimentato da Granite, per la codifica generale; debutta con nuovi strumenti in watsonx.ai per la creazione e la distribuzione di applicazioni e agenti di intelligenza artificiale

- Annuncia che Granite diventerà il modello predefinito di Consulting Advantage, una piattaforma di consegna alimentata dall'AI utilizzata dai 160.000 consulenti IBM per portare nuove soluzioni ai clienti in modo più rapido

ARMONK, N.Y., 21 ottobre 2024 /PRNewswire/ -- Oggi, in occasione dell'evento IBM (NYSE: IBM), l'azienda ha annunciato il rilascio della sua famiglia di modelli AI più avanzati, Granite 3.0. I modelli linguistici di terza generazione Granite di IBM sono in grado di superare o di eguagliare i modelli di dimensioni simili dei principali fornitori di modelli su molti benchmark accademici e industriali, dimostrando ottime prestazioni, trasparenza e sicurezza.

In linea con l'impegno dell'azienda verso l'AI open-source, i modelli Granite sono rilasciati sotto la licenza permissiva Apache 2.0, il che li rende unici per la combinazione di prestazioni, flessibilità e autonomia che offrono ai clienti aziendali e alla comunità in generale.

La famiglia Granite 3.0 di IBM comprende:

  • Uso generale/linguaggio: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • Guardrail e sicurezza: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • Miscela di esperti: Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

I nuovi modelli linguistici Granite 3.0 8B e 2B sono stati progettati come modelli 'cavalli di battaglia' per l'IA aziendale, offrendo prestazioni elevate per compiti come la Generazione Aumentata del Recupero (RAG), la classificazione, la sintesi, l'estrazione di entità e l'uso di strumenti. Questi modelli compatti e versatili sono progettati per essere messi a punto con i dati aziendali e integrati senza problemi in diversi ambienti aziendali o flussi di lavoro.

Mentre molti modelli linguistici di grandi dimensioni (LLM) sono addestrati su dati disponibili pubblicamente, la maggior parte dei dati aziendali rimane inutilizzata. Combinando un piccolo modello Granite con i dati aziendali, in particolare utilizzando la rivoluzionaria tecnica di allineamento InstructLab - introdotta da IBM e RedHat a maggio - IBM ritiene che le aziende possano ottenere prestazioni specifiche che rivaleggiano con i modelli più grandi a una frazione del costo (sulla base di un intervallo osservato di costi 3x-23x inferiori rispetto ai modelli di frontiera di grandi dimensioni in diversi primi proof-of-concept1).

Il rilascio di Granite 3.0 riafferma l'impegno di IBM a costruire trasparenza, sicurezza e fiducia nei prodotti AI. Il Relazione tecnica di Granite 3.0 e la guida all'uso responsabile forniscono una descrizione dei set di dati utilizzati per addestrare questi modelli, i dettagli delle fasi di filtraggio, pulizia e curation applicate, oltre a risultati completi delle prestazioni dei modelli attraverso i principali benchmark accademici e aziendali.

In particolare, IBM fornisce una garanzia di proprietà intellettuale per tutti i modelli Granite su watsonx.ai, in modo che i clienti aziendali possano essere più sicuri di unire i loro dati ai modelli.

Alzare l'asticella: I benchmark di Granite 3.0

I modelli linguistici Granite 3.0 mostrano anche risultati promettenti sulle prestazioni grezze.

Sui benchmark accademici standard definiti dalla OpenLLM Leaderboard di Hugging Face, le prestazioni complessive del modello Granite 3.0 8B Instruct sono in media superiori a quelle dei modelli open source di dimensioni simili di Meta e Mistral. Nel benchmark di sicurezza AttaQ di IBM, il modello Granite 3.0 8B Instruct è in testa in tutte le dimensioni di sicurezza misurate, rispetto ai modelli di Meta eMistral2

Nei compiti aziendali fondamentali di RAG, nell'uso degli strumenti e nei compiti del dominio Cybersecurity, il modello Granite 3.0 8B Instruct mostra prestazioni leader in media rispetto ai modelli open source di dimensioni simili di Mistral e Meta.3

I modelli Granite 3.0 sono stati addestrati su oltre 12 trilioni di token su dati tratti da 12 lingue naturali diverse e 116 linguaggi di programmazione diversi, utilizzando un nuovo metodo di addestramento in due fasi, sfruttando i risultati di diverse migliaia di esperimenti progettati per ottimizzare la qualità dei dati, la selezione dei dati e i parametri di addestramento. Entro la fine dell'anno, si prevede che i modelli linguistici 3.0 8B e 2B includeranno il supporto per una finestra di contesto estesa a 128K e capacità di comprensione multimodale dei documenti.

Dimostrando un eccellente equilibrio tra prestazioni e costi di inferenza, IBM offre i suoi modelli Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B-A400M e Granite 3.0 3B-A800M, come modelli più piccoli e leggeri che possono essere implementati per applicazioni a bassa latenza e per implementazioni basate su CPU.

IBM annuncia anche una versione aggiornata dei suoi modelli preaddestrati Granite Time Series, le cui prime versioni sono state rilasciate all'inizio di quest'anno. Questi nuovi modelli sono stati addestrati su un numero di dati 3 volte superiore e offrono ottime prestazioni su tutti e tre i principali benchmark di serie temporali, superando i modelli 10 volte più grandi di Google, Alibaba e altri. I modelli aggiornati offrono anche una maggiore flessibilità di modellazione con il supporto di variabili esterne e previsioni rolling.4

Presentazione di Granite Guardian 3.0: inaugurare la prossima era dell'AI responsabile

Nell'ambito di questa release, IBM sta introducendo anche una nuova famiglia di modelli Granite Guardian, che consentono agli sviluppatori di applicazioni di implementare dei guardrail di sicurezza, controllando le richieste dell'utente e le risposte dell'LLM per una serie di rischi. I modelli Granite Guardian 3.0 8B e 2B offrono la serie più completa di funzionalità di rilevamento dei rischi e dei danni disponibili oggi sul mercato.

Oltre alle dimensioni del danno come pregiudizio sociale, odio, tossicità, blasfemia, violenza, violazione di domicilio e altro ancora, questi modelli offrono anche una serie di controlli unici specifici per i RAG, come la fondatezza, la pertinenza del contesto e la pertinenza delle risposte. Nei test approfonditi su 19 benchmark di sicurezza e RAG, il modello Granite Guardian 3.0 8B ha un'accuratezza complessiva più elevata nel rilevamento dei danni, in media, rispetto a tutte e tre le generazioni di modelli Llama Guard di Meta. Inoltre, ha mostrato prestazioni complessive pari al rilevamento delle allucinazioni, in media con i modelli specializzati nel rilevamento delle allucinazioni WeCheck e MiniCheck.5

Sebbene i modelli Granite Guardian siano derivati dai corrispondenti modelli linguistici Granite, possono essere utilizzati per implementare guardrail accanto a qualsiasi modello AI aperto o proprietario.

Disponibilità dei modelli Granite 3.0

L'intera suite di modelli Granite 3.0 e i modelli aggiornati delle serie temporali sono disponibili per il download su HuggingFace sotto la licenza permissiva Apache 2.0. Le varianti istruttive dei nuovi modelli linguistici Granite 3.0 8B e 2B e i modelli Granite Guardian 3.0 8B e 2B sono disponibili oggi per uso commerciale sulla piattaforma watsonx di IBM. Una selezione dei modelli Granite 3.0 sarà disponibile anche come microservizi NVIDIA NIM e attraverso le integrazioni di Vertex AI Model Garden di Google Cloud con HuggingFace.

Per aiutare a fornire agli sviluppatori una scelta e una facilità d'uso e per supportare le implementazioni locali, edge, una serie curata di modelli Granite 3.0 è disponibile anche su Ollama e Replicate.

L'ultima generazione di modelli Granite amplia il solido catalogo open-source di potenti LLM di IBM. IBM ha collaborato con partner dell'ecosistema come AWS, Docker, Domo, Qualcomm Technologies, Inc. tramite il suo Qualcomm® AI Hubsalesforce, SAPe altri, per integrare una varietà di modelli Granite nelle offerte di questi partner o rendere disponibili i modelli Granite sulle loro piattaforme, offrendo una maggiore scelta alle aziende di tutto il mondo.

Da assistenti ad agenti: realizzare il futuro dell'AI aziendale

IBM sta facendo progredire l'AI aziendale attraverso uno spettro di tecnologie: dai modelli e dagli assistenti, agli strumenti necessari per mettere a punto e distribuire l'AI in modo specifico per i dati e i casi d'uso unici delle aziende. IBM sta anche aprendo la strada a futuri agenti AI in grado di auto-dirigersi, riflettere e svolgere compiti complessi in ambienti aziendali dinamici.

IBM continua ad evolvere il suo portafoglio di tecnologie di assistenti AI - da watsonx Orchestrate per aiutare le aziende a costruire i propri assistenti tramite strumenti e automazione low-code, ad un'ampia serie di assistenti precostituiti per compiti e settori specifici come il servizio clienti, le risorse umane, le vendite e il marketing. Le organizzazioni di tutto il mondo hanno utilizzato watsonx Assistant per aiutarle a costruire assistenti AI per compiti come rispondere alle domande di routine dei clienti o dei dipendenti, modernizzare i loro mainframe e le applicazioni IT legacy, aiutare gli studenti a esplorare potenziali percorsi di carriera o fornire assistenza digitale per i mutui agli acquirenti di case.

Oggi IBM ha anche presentato l'imminente release della prossima generazione di watsonx Code Assistantalimentato dai modelli di codice Granite, per offrire un'assistenza di codifica generica in linguaggi come C, C++, Go, Java e Python, con funzionalità avanzate di modernizzazione delle applicazioni per le applicazioni Enterprise Java.6 Le funzionalità di codice di Granite sono ora accessibili anche attraverso un'estensione di Visual Studio Code, IBM Granite.Code.

IBM prevede anche di rilasciare nuovi strumenti per aiutare gli sviluppatori costruire, personalizzare e distribuire l'AI in modo più efficiente tramite watsonx.ai - compresi i framework agenziali, le integrazioni con gli ambienti esistenti e le automazioni low-code per i casi d'uso comuni come RAG e agenti.7

IBM si sta concentrando sullo sviluppo di tecnologie di agenti di AI in grado di avere una maggiore autonomia, un ragionamento sofisticato e la risoluzione di problemi in più fasi. La versione iniziale del modello Granite 3.0 8B presenta il supporto di capacità agenziali chiave, come il ragionamento avanzato e un modello di chat altamente strutturato e uno stile di prompting per l'implementazione di flussi di lavoro per l'uso di strumenti. IBM prevede anche di introdurre una nuova funzione di chat con agenti AI in IBM watsonx Orchestrate, che utilizza le capacità agenziali per orchestrare assistenti AI, competenze e automazioni che aiutano gli utenti ad aumentare la produttività dei loro team.8 IBM prevede di continuare a costruire capacità di agenti in tutto il suo portafoglio nel 2025, compresi agenti precostituiti per domini e casi d'uso specifici.

Piattaforma di consegna potenziata dall'AI per potenziare i consulenti IBM con l'AI

IBM sta anche annunciando un'importante espansione della sua piattaforma di consegna alimentata dall'AI, IBM Consulting Advantage. La piattaforma multi-modello contiene agenti AI, applicazioni e metodi come framework ripetibili che possono consentire a 160.000 consulenti IBM di fornire un valore migliore e più rapido ai clienti a un costo inferiore.

Come parte dell'espansione, i modelli linguistici di Granite 3.0 diventeranno il modello predefinito in Consulting Advantage. Sfruttando le prestazioni e l'efficienza di Granite, IBM Consulting sarà in grado di aiutare a massimizzare il ritorno sull'investimento per i progetti di AI generativa dei clienti IBM.

Un'altra parte fondamentale dell'espansione è l'introduzione di IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operations. Ognuno di questi include agenti, applicazioni e metodi di AI specifici per il dominio, infusi con le best practice di IBM, in modo che i consulenti IBM possano aiutare ad accelerare le trasformazioni del cloud e dell'AI dei clienti in attività come la modernizzazione del codice e l'ingegneria della qualità, o a trasformare ed eseguire le operazioni in tutti i domini, come la finanza, le risorse umane e gli acquisti.

Per saperne di più su Granite e sulla strategia AI for Business di IBM, visiti il sito www.ibm.com/granite.

1 I calcoli dei costi si basano sui prezzi del costo API per milione di token di IBM watsonx per i modelli aperti e openAI per i modelli GPT4 (ipotizzando una miscela di 80% inout, 20% output) per le prove di concetto dei clienti.
2 Documento tecnico di IBM Research: Modelli linguistici Granite 3.0
3 Documento tecnico di IBM Research: Modelli linguistici di Granite 3.0
4 Il Tiny Time Mixer: Modelli veloci pre-addestrati per una previsione migliorata di zero/pochi colpi su serie temporali multivariate
5 Risultati della valutazione pubblicati in Granite Guardian GitHub Repo
6 Disponibilità prevista per il 4° trimestre 2024
7 Disponibilità prevista per il 4° trimestre 2024
8 Disponibilità prevista per il 1° trimestre 2025

Please share our article, every link counts!
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 10 > IBM lancia i modelli di intelligenza artificiale open-source Granite 3.0 per le aziende
Codrut Nistor, 2024-10-22 (Update: 2024-10-22)