Esattamente un mese fa, molti quotidiani e organi di stampa avevano dedicato ampio spazio al lancio del primo LLM interamente realizzato in Italia e addestrato da zero per la lingua italiana. Approfondimenti giusti e legittimi, visto che si è trattato del primo approccio concreto di una realtà nostrana nei confronti dei variegati strati profondi alla base dei sistemi di intelligenza artificiale. Si chiama Minerva LLM ed è stato realizzato da un team di ricerca all’interno dll’Università La Sapienza di Roma. Ma questa famiglia di modelli di linguaggi su larga scala – ovvero la base di una AI – è attualmente immersa in una serie di problemi e criticità che non la rendono affidabile.

Minerva LLM, il progetto italiano ha tanti problemi

Le prime tre versioni (che hanno tre database differenti per quel che riguarda il numero di fonti) sono state caricate qualche settimana fa sulla piattaforma HuggingFace e molti utenti hanno potuto testare le potenzialità di questo sistema. Ed è proprio lì che si sono palesati alcuni (molti) problemi che dovranno essere risolti per dare vita a un modello realmente funzionante per la lingua italiana. Da risposte completamente sbagliate a riferimenti storico-culturali privi di senso, oltre a un continuo riferimento ad aspetti legati alla sessualità. Criticità provocate da un dataset (pubblico) piuttosto limitato e non di qualità.

Ma questo progetto ha enormi potenzialità, radicandosi nel sistema universitario italiano. Perché si è potuto sviluppare grazie all’utilizzo di fondi del PNRR e si spera che anche dopo il lancio si prosegua in quella stessa direzione. È importante, infatti, che l’Italia crei un ecosistema favorevole allo sviluppo etico di questi sistemi AI in modo tale da colmare quel gap che costringe il nostro Paese a rivolgersi esclusivamente ai grandi attori multinazionali. E, di pari passo, servono investimenti (anche a livello di capitale umano) per pagare il giusto chi lavora per sviluppare queste soluzioni.