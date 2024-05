Cinquecento miliardi di parole, un po’ come leggere 5 milioni di romanzi. Tutte in lingua italiana. Per questo motivo, Minerva LLM è il primo Large Language Model che percepisce la nostra lingua come nativa. Gli LLM sono i presupposti su cui si basano gli strumenti di intelligenza artificiale: è a partire dalla loro efficacia, sia a livello di comprensione, sia a livello di generazione del linguaggio, che si sviluppa la capacità di un chatbot di comprendere e offrire risposte. Gli LLM su cui si basano i più grandi, noti e sviluppati strumenti di intelligenza artificiale hanno una base in inglese e, per questo motivo, possono essere meno efficaci quando vanno ad eseguire, di fatto, delle traduzioni. Il progetto sviluppato da Sapienza NLP in collaborazione con Future Artificial Intelligence Research (FAIR) e CINECA punta proprio a colmare questo gap.

Minerva LLM, come sta andando il progetto della Sapienza

Fino a questo momento, i tentativi di realizzare un LLM in italiano si sono basati esclusivamente su riadattamenti di altri LLM i cui dati di addestramento, però, non risultano essere conosciuti. Il prodotto è figlio di finanziamenti ottenuti grazie ai cosiddetti cascade grants: l’Unione Europea – Next Generation EU sui fondi PNRR MUR ha finanziato il progetto Future Artificial Intelligence (per una somma totale di un milione e 350mila euro). La somma del finanziamento è poi stata distribuita a cascata suddivisa in lotti da 225mila euro. Di uno di questi lotti ha potuto beneficiare anche Minerva LLM, che ha anche potuto avvalersi della collaborazione di CINECA, il Consorzio Interuniversitario senza scopo di lucro a totale partecipazione pubblica che ha come focus principale della sua attività il supercalcolo e la trasformazione digitale della pubblica amministrazione.

Il progetto Minerva LLM è molto giovane e, per questo motivo, ancora acerbo. Roberto Navigli, alla guida di Sapienza Nlp, lo ha presentato il mese scorso: «Minerva – ha detto in quella circostanza – sono dei modelli ‘foundation’ come quelli alla base di ChatGpt e presto, al massimo due mesi, rilasceremo anche una versione con chat capace di interagire facilmente con un utente tradizionale, non solo per addetti ai lavori». Al momento, questa interazione – come ha evidenziato Hugging Face – non offre dei risultati particolarmente brillanti, come andremo a esaminare in un altro articolo del nostro monografico di oggi.

Tuttavia, c’è da dire che il team che sta cercando di realizzare questa impresa, al momento, è estremamente ridotto e – quantitativamente – non può di certo competere con le squadre che realizzano i modelli alla base dei giganti dell’intelligenza artificiale (OpenAI, per esempio, ma anche Meta). Probabilmente, il lavoro dovrà passare anche da una maggiore attenzione sulle fonti: al momento quella più utilizzata è docplayer.it (una piattaforma gratuita per pubblicare e scambiare informazione attraverso alcuni strumenti messi a disposizione dal team), seguita dall’importante e sempre fondamentale archivio di Radio Radicale. Nelle prime posizioni delle fonti utilizzate, inoltre, troviamo il sito web del quotidiano Il Giornale oppure il sito di Blasting News. Inoltre, sarà necessario attirare degli importanti capitali, visto che – al momento – le somme che sono state investite non sono sicuramente competitive rispetto a quelle degli altri colossi americani, ma anche del francese Mistral. Insomma, un enorme cartello di work in progress.