I ricercatori dell'Università Tsinghua costruiscono un Agent Hospital virtuale per l'addestramento dei medici AI senza intervento umano
I ricercatori dell'Università Tsinghua del Intelligent Industry Research Institute (AIR) e del Dipartimento di Informatica e Tecnologia https://www.cs.tsinghua.edu.cn/csen/ hanno costruito un Agent Hospital virtuale per la formazione di medici AI senza intervento umano. Per prima cosa hanno creato una simulazione di un intero ospedale con personale e pazienti. Ai medici AI è stata poi affidata la responsabilità di diagnosticare e curare migliaia di pazienti virtuali senza l'intervento umano. I medici hanno imparato rapidamente dai loro errori e le loro capacità di esaminare, diagnosticare e curare sono aumentate in modo significativo.
Le simulazioni virtuali, o simulacri, replicano un ambiente reale per un addestramento sicuro e rapido dell'IA. Non è necessario che il computer attenda la comparsa di un paziente malato, ma si possono programmare centinaia, migliaia o addirittura milioni di pazienti malati da far comparire come desiderato. Il costo di queste simulazioni è anche molto più basso rispetto alla formazione vera e propria.
I ricercatori di Tsinghua sono stati in grado di addestrare rapidamente medici AI virtuali su 10.000 pazienti virtuali nella simulazione Agent Hospital, utilizzando il loro processo chiamato metodo MedAgent-Zero. Questi sono stati creati alimentando modelli di grandi dimensioni di informazioni su otto tipi di malattie per creare cartelle cliniche elettroniche per 10.000 pazienti virtuali, ognuno dei quali aveva una gravità e una presentazione diversa. Queste otto malattie erano rinofaringite acuta, rinite acuta, asma bronchiale, bronchite cronica, COVID-19, influenza A, influenza B e infezione da micoplasma. Per i test è stato creato un set separato di 500 cartelle cliniche.
Durante le simulazioni, il medico virtuale alimentato da gpt-3.5-turbo-1106 ha sviluppato rapidamente le proprie competenze. Dopo aver visto 10.000 pazienti virtuali, il medico ha avuto tassi di successo nell'esaminare, diagnosticare e trattare i pazienti dell'88%, 95,6% e 77,6% a seconda della malattia.
Il GPT sta migliorando rapidamente, quindi i ricercatori di Tsinghua hanno anche testato il loro metodo di addestramento MedAgent-Zero utilizzando il più potente gpt-4-1106-preview. Hanno confrontato le prestazioni dei medici AI gpt-3 e gpt-4 utilizzando 1.273 domande del database MedQAun'ampia serie di domande a scelta multipla che sono simili alle domande di abilitazione alla professione medica che si trovano in test come il USMLE. Le prestazioni dei medici virtuali sulle domande relative alle malattie respiratorie sono state del 93,06% gpt-4 rispetto all'84,72% gpt-3.
Le prestazioni rivoluzionarie di questi medici AI sono state ottenute con pochi giorni di addestramento virtuale, e il simulacro dell'Agent Hospital apre la strada allo sviluppo di metodi di addestramento per i futuri medici AI, così come per i medici reali, che siano significativamente più rapidi ed efficaci.
I lettori che non sanno quali posti di lavoro rimarranno in un futuro alimentato dall'IA, possono solo dire ai loro robot umanoidi 1X di preparare la cena e pulire la casa per loro. Coloro che vogliono costruire l'IA dovrebbero dotare i loro PC di una GPU Nvidia veloce(come questa su Amazon) o acquistare uno dei computer portatili più veloci del pianeta(come questo su Amazon) per iniziare ad addestrare l'IA ad assumere molti lavori.
Fonte(i)
Tradotto automaticamente dal browser Edge:
AIR crea un ospedale virtuale per realizzare l'auto-evoluzione dei medici AI
Tempo di rilascio: 2024-05-24
L'Istituto di Ricerca sull'Industria Intelligente dell'Università Tsinghua (AIR) e il Dipartimento di Informatica e Tecnologia dell'Università Tsinghua hanno collaborato per costruire un ospedale virtuale, Agent HospitalMedAgent-Zero, un metodo di auto-evoluzione per gli agenti medici, che consente agli agenti medici di migliorare continuamente le loro capacità mediche generando una grande quantità di dati senza annotazione manuale negli ospedali virtuali, ed è verificato in serie di dati del mondo reale. Tutti i pazienti, gli infermieri e i medici dell'Agent Hospital sono interpretati da agenti autonomi guidati da modelli di grandi dimensioni, che simulano il processo a ciclo chiuso di "pre-ospedale-in-ospedale-post-ospedale" di insorgenza, triage, registrazione, consultazione, esame, diagnosi, medicazione, riabilitazione e follow-up. Sulla base della base di conoscenza e del modello di base, l'Agent Hospital simula il processo di generazione e sviluppo della malattia dei pazienti virtuali. I medici virtuali imparano (cioè leggono la letteratura medica) e fanno pratica (cioè interagiscono con i pazienti virtuali e prendono decisioni di diagnosi e trattamento) nell'Agent Hospital, riassumono costantemente l'esperienza dei casi di diagnosi e trattamento di successo, riflettono sulle lezioni dei casi falliti e migliorano continuamente l'accuratezza dei compiti multipli di diagnosi e trattamento. Dopo aver trattato quasi 10.000 pazienti virtuali (ci vogliono circa 2 anni per i medici umani), i medici virtuali sono stati in grado di superare i migliori metodi attuali sul sottoinsieme di malattie respiratorie del set di dati MedQA, raggiungendo un tasso di precisione del 93,06%. Lo studio, di cui sono coautori l'Assistente Prof. Ma Weizhi dell'AIR e il Prof. Yang Liu, Decano Esecutivo dell'AIR e Decano Associato del Dipartimento di Informatica, ha ricevuto un'ampia attenzione e discussione da parte della comunità dell'intelligenza artificiale e della comunità medica in patria e all'estero dopo la sua pubblicazione su arXiv.
- Titolo dell'articolo: Agent Hospital: Un simulacro di ospedale con agenti medici evolvibili
- Link al documento: arxiv.org/pdf/2405.02957v1
Negli ultimi anni, i modelli linguistici su larga scala si sono sviluppati con vigore e la tecnologia degli agenti basata su modelli linguistici di grandi dimensioni ha attirato molta attenzione. Gli studi precedenti hanno utilizzato la tecnologia degli agenti per realizzare simulazioni del mondo reale, compresi scenari di interazione e di gioco come "Stanford Town" e "Werewolf Killing Game". Allo stesso tempo, la tecnologia degli agenti viene utilizzata anche nella pianificazione della programmazione e nel processo di collaborazione di vari compiti, ma questo processo si basa principalmente sul supporto di dati annotati manuali di alta qualità. Pertanto, la domanda di ricerca è se la simulazione del mondo reale può aiutare a migliorare la capacità di elaborazione dei compiti degli agenti.
L'assistenza sanitaria intelligente ha attirato un'ampia attenzione per la sua importanza e il suo valore applicativo, e il team di ricerca ha prestato grande attenzione all'applicazione dei modelli linguistici di grandi dimensioni e della tecnologia degli agenti negli scenari medici. In risposta alle domande di ricerca di cui sopra, il team ritiene che l'ambiente del modello reale possa aiutare la capacità di compito degli agenti a migliorare ed evolvere, per cui ha condotto la ricerca Agent Hospital che combina la simulazione del mondo reale e il miglioramento della capacità medica. In questo lavoro, il team si impegna a costruire un ambiente di simulazione ospedaliera e ad esplorare l'evoluzione autonoma degli agenti medici in questo ambiente. Lo scopo è quello di consentire agli agenti di accumulare autonomamente le conoscenze mediche nel processo di diagnosi e trattamento e di apprendimento, proprio come i medici umani, e di realizzare l'evoluzione continua delle capacità mediche.
Il team di ricerca si è prima concentrato sull'utilizzo di agenti modello su larga scala per simulare i processi medici critici del mondo reale. Nell'Agent Hospital, il team ha progettato e coperto 8 scenari tipici, dalla generazione della malattia alla guarigione, ossia: insorgenza, triage, registrazione, consultazione, esame, diagnosi, prescrizione e guarigione, e i pazienti parteciperanno attivamente al feedback di follow-up. Tutti i processi sono supportati da modelli di grandi dimensioni in cui i ruoli possono interagire autonomamente.
Esempi di importanti sessioni di diagnosi e trattamento
Il diagramma qui sopra illustra un approccio a circuito chiuso: quando Kenneth Morgan, l'agente del paziente, si ammala, si reca in ospedale per chiedere aiuto. L'infermiera di triage Katherine Li capisce i sintomi di Morgan, lo analizza e lo indirizza a un reparto specifico. Dopo che Morgan ha completato la registrazione, la consultazione e la visita medica secondo le istruzioni del medico, il medico Robert gli darà la diagnosi finale e il piano di trattamento, e Morgan andrà a casa a riposare secondo le istruzioni del medico e darà un riscontro all'ospedale per il recupero, fino alla prossima volta che si ammalerà e andrà in ospedale.
Come si può vedere dall'esempio precedente, il team di ricerca ha progettato due tipi principali di ruoli per l'ospedale: il personale medico e i pazienti. Tutte le informazioni dei personaggi sono generate da un modello di grandi dimensioni (GPT-3.5), quindi possono essere facilmente scalate e aggiunte. Le informazioni specifiche di alcuni personaggi sono mostrate nella figura sottostante, il paziente Kenneth Morgan, di 35 anni, ha attualmente una rinite acuta, una storia di ipertensione e una serie di sintomi come il vomito persistente; Zhao Lei è un radiologo esperto e l'internista Elise Martin ha eccellenti capacità di comunicazione ed è specializzata nella diagnosi e nel trattamento di malattie mediche acute e croniche. Questi sfondi informativi completi sui personaggi aumentano il realismo della simulazione ospedaliera.
Un'introduzione alle informazioni del personaggio virtuale
Nel processo di simulazione medica di cui sopra, la generazione della malattia è la chiave. In particolare, le informazioni della cartella clinica attuale sono generate da un modello linguistico di grandi dimensioni, combinato con le conoscenze mediche, per generare una cartella clinica completa del paziente, che include il tipo di malattia, i sintomi, la durata e i vari risultati degli esami (per i dettagli, vedere l'appendice del documento). Va notato che per garantire il più possibile l'accuratezza dell'intero processo di simulazione, l'agente paziente percepirà solo i sintomi della sua malattia, ma non la malattia specifica, mentre l'agente medico potrà comprendere le informazioni solo parlando con l'agente paziente e prescrivendo gli esami. L'esame che l'agente paziente deve eseguire, il tipo di malattia e la gravità della malattia saranno utilizzati come tre compiti chiave per valutare la capacità dell'agente medico di diagnosticare e trattare i pazienti virtuali.
La maggior parte dei metodi tradizionali di addestramento dei modelli medici si basa su pre-addestramento, messa a punto e altre tecnologie, quindi devono essere supportati da una grande quantità di dati medici e da alcuni dati annotati manualmente di alta qualità. Tuttavia, il team di ricerca ritiene che il processo di miglioramento delle capacità dei medici umani non si basa su dati così massicci, e spesso possono accumulare esperienza dalla pratica clinica nel processo di diagnosi e trattamento, e miglioreranno anche leggendo la letteratura medica per accumulare conoscenze chiave. Gli agenti medici negli ospedali virtuali dovrebbero essere in grado di raggiungere un'evoluzione delle capacità simile.
Pertanto, il team ha progettato un algoritmo di auto-evoluzione dell'agente denominato "MedAgent-Zero", che, come AlphaGo-Zero, non si basa sui dati di annotazione manuale, ma utilizza l'apprendimento (cioè la lettura della letteratura medica) e la pratica (cioè l'interazione con i pazienti virtuali e le decisioni di diagnosi e trattamento) nell'ospedale virtuale per ottenere un miglioramento delle capacità. Accumulare in modo indipendente l'esperienza sui tre compiti di diagnosi della malattia e raccomandazioni terapeutiche; d'altra parte, gli agenti medici impareranno anche in modo autonomo, simulando il processo di apprendimento dei documenti medici sulla base delle domande mediche generate dal LLM.
Diagramma di flusso della politica MedAgent-Zero
Come mostrato nella figura precedente, l'evoluzione di MedAgent-Zero comprende due approcci: 1) Riassumere l'esperienza dei casi di successo, per i problemi di diagnosi e trattamento a cui si può rispondere correttamente, l'organismo intelligente accumulerà l'esperienza del database dei casi come un medico umano; 2) Riflettere sulle lezioni apprese dai fallimenti, e quando si risponde agli errori, l'agente prenderà l'iniziativa di riflettere sugli errori e rifletterà su di essi. Se gli insegnamenti tratti dalla riflessione aiutano l'agente a rispondere alla domanda, saranno conservati e archiviati nel pool di esperienze.
Alla fine, il team di ricerca effettuerà l'accumulo e l'evoluzione dei due aspetti di cui sopra nel processo di formazione sui dati virtuali. In ogni processo di inferenza, l'agente recupera il contenuto più simile dai due database e lo aggiunge al Prompt per l'apprendimento nel contesto, e accumula cartelle cliniche o riassume l'esperienza in base alle risposte corrette ed errate, in modo da migliorare continuamente l'abilità dell'agente.
Nell'ospedale virtuale, il team di ricerca ha costruito le cartelle cliniche di decine di migliaia di pazienti virtuali per gli esperimenti di evoluzione autonoma degli agenti medici, tra cui 8 malattie legate all'apparato respiratorio, come l'influenza A, l'influenza B e la nuova corona, che comportano più di 10 esami medici diversi. In base al calcolo che i medici umani trattano circa 100 pazienti a settimana, potrebbero essere necessari due anni per i medici umani per diagnosticare 10.000 pazienti, ma i medici intelligenti impiegano solo pochi giorni per farlo.
Il team ha valutato principalmente la capacità degli agenti medici negli ospedali virtuali sotto due aspetti. Il primo è la valutazione della competenza medica nell'ambiente virtuale: come mostrato nella figura sottostante, nel processo di formazione dell'agente medico (a sinistra), con l'aumento del numero di pazienti diagnosticati e trattati, l'accuratezza dell'agente medico sui tre compiti chiave continua ad aumentare e si stabilizza gradualmente. Nell'esperimento di 500 cartelle cliniche di prova, è stato riscontrato (a destra) che l'accuratezza dell'agente medico fluttuava leggermente con l'aumento del numero di pazienti, ma mostrava una tendenza generale all'aumento.
L'accuratezza del compito dell'agente medico sul set di formazione (a sinistra) e sul set di test (a destra).
Successivamente, il team di ricerca ha confrontato l'accuratezza diagnostica degli agenti medici su diverse malattie prima e dopo la loro evoluzione, e ha scoperto che erano tutti notevolmente migliorati, verificando l'efficacia della loro evoluzione autonoma.
Manifestazioni diagnostiche di diverse malattie prima e dopo l'evoluzione degli agenti
D'altra parte, il team ha utilizzato un sottoinsieme di malattie respiratorie dal set di dati esterni MedQA per valutare la capacità dell'agente medico nella medicina del mondo reale. Sorprendentemente, anche senza utilizzare dati annotati artificialmente nel processo di evoluzione dell'agente, dopo aver trattato quasi 10.000 pazienti, l'agente medico è stato in grado di superare l'attuale miglior metodo sul set di dati e di raggiungere il più alto tasso di precisione del 93,06%, il che verifica l'efficacia dell'evoluzione autonoma degli agenti medici nell'ambiente simulato.
Accuratezza dei diversi metodi su un sottoinsieme di MedQA
Inoltre, il team di ricerca ha effettuato una verifica sperimentale dell'ablazione e i risultati hanno dimostrato che sia gli esempi accumulati dai successi che le lezioni apprese dai fallimenti possono aiutare a migliorare le capacità mediche del modello.
Prestazioni del test di ablazione di MedAgent-Zero
In sintesi, questo lavoro di ricerca costruisce il primo scenario ospedaliero virtuale, Agent Hospital, e propone MedAgent-Zero, un algoritmo di evoluzione degli agenti medici che non si basa sull'annotazione di dati artificiali. I risultati sperimentali dei dati virtuali e dei dati reali verificano preliminarmente l'efficacia dell'ambiente di simulazione per il miglioramento delle capacità degli agenti medici e propongono nuove soluzioni per l'applicazione dell'intelligenza artificiale, in particolare dei modelli linguistici di grandi dimensioni e della tecnologia degli agenti negli scenari medici intelligenti. Tuttavia, ci sono ancora alcune limitazioni in questo lavoro di ricerca e in futuro il team continuerà a migliorare e ottimizzare i tipi di malattia coperti, la meticolosità dell'ambiente di simulazione e la selezione e l'ottimizzazione del modello di base.
Informazioni sull'autore corrispondente
Ma Weizhi, ricercatore assistente presso l'Istituto di Industria Intelligente (AIR) dell'Università Tsinghua, è stato selezionato come "Giovane Talento del Progetto Lifting" dell'Associazione Cinese per la Scienza e la Tecnologia. I suoi interessi di ricerca includono l'acquisizione di informazioni intelligenti e l'assistenza medica intelligente. Sito personale: mawz12.github.io.
Liu Yang è Professore di GDS, Preside Esecutivo dell'Istituto di Industria Intelligente (AIR), Vice Preside del Dipartimento di Informatica dell'Università Tsinghua e vincitore del Fondo Nazionale per Giovani Studiosi Illustri. I suoi interessi di ricerca includono l'intelligenza artificiale, l'elaborazione del linguaggio naturale e la medicina intelligente. Sito personale: nlp.csai.tsinghua.edu.cn/~ly.
I nostri Top 10
» Top 10 Portatili Multimedia
» Top 10 Portatili Gaming
» Top 10 Portatili Gaming Leggeri
» Top 10 Portatili da Ufficio e Business economici
» Top 10 Portatili Premium da Ufficio/Business
» Top 10 Portatili sotto i 300 Euro
» Top 10 Portatili sotto i 500 Euro
» Top 10 dei Portatili Workstation
» Top 10 Subnotebooks
» Top 10 Ultrabooks
» Top 10 Convertibili
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Smartphones