Notebookcheck Logo

Whisperfile del team Mozilla Ocho offre un ASR locale e semplice

progetto llamafile (Fonte immagine: Mozilla)
progetto llamafile (Fonte immagine: Mozilla)
Il team noto per l'innovazione e gli esperimenti di Mozilla ha integrato il sistema di riconoscimento vocale automatico Whisper di OpenAI nel suo progetto llamafile. Il progetto mira a fornire modelli linguistici di grandi dimensioni, compatibili con l'hardware locale, in un unico file eseguibile. La possibilità di eseguire localmente un software di trascrizione può essere utile agli utenti attenti alla privacy che desiderano trascrivere audio sensibili.

Per coloro che non hanno familiarità con il progetto llamafile il team di Mozilla Ocho sta lavorando per eliminare la complessità dell'installazione di LLM, combinando llama.cpp e Cosmopolitan Libc, che utilizzano entrambi il linguaggio di programmazione C/C++. Llamafile utilizza l'inferenza di LLaMA di Meta di Meta fornito da llama.cpp e lo accoppia con la trasformazione build-once run-anywhere di C di Cosmopolitan Libc. Cosmopolitan Libc elimina anche la necessità di un interprete o di una macchina virtuale per eseguire C su macchine Linux, Mac e Windows.

L'ultima novità del progetto llamafile, Whisperfileè stato descritto nel profilo Hugging Face di Mozilla. Secondo la loro pagina, "Whisperfile è un'implementazione ad alte prestazioni di OpenAI Whisper creato da Mozilla Ocho come parte del progetto llamafile, basato sul software whisper.cpp scritto da Georgi Gerganov, et al." Per il progetto, il team ha impacchettato tutti i pesi necessari per il modello in "whisperfiles" che mantengono le caratteristiche trovate in Cosmopolitan Libc, consentendo al modello di funzionare sulla maggior parte dei sistemi.

La documentazione "Getting Started with Whisperfile" sul profilo GitHub del team illustra un semplice processo di installazione che consiste in soli tre passaggi. Una volta scaricato il modello, creato il software ed eseguito il programma, l'utente può scegliere tra tre diversi modelli per iniziare a trascrivere l'audio. I modelli variano da piccoli a grandi, con la velocità che viene scambiata con la precisione nel processo di trascrizione. Inoltre, Whisperfile può tradurre diverse lingue in inglese utilizzando il modello multilingue e il flag "--translate".

Per informazioni su llamafile, Whisperfile e ulteriori dettagli sul processo di installazione, visiti le risorse qui sotto.

Fonte(i)

Please share our article, every link counts!
> Recensioni e prove di notebook, tablets e smartphones > News > Newsarchive 2024 08 > Whisperfile del team Mozilla Ocho offre un ASR locale e semplice
Stephen Pereyra, 2024-08-23 (Update: 2024-08-23)