OpenAI ha ufficialmente lanciato la sua intelligenza artificiale in grado di ragionare

Tempi di riflessione più lunghi prima di dare una risposta, competenze anche in ambito STEM: ecco la vera essenza del progetto "Strawberry", presentato dall'azienda di Sam Altman come OpenAI-o1

13/09/2024 di Gianmichele Laino

Ora, oltre ai rumors, c’è anche un comunicato ufficiale sul blog. È stata lanciata definitivamente OpenAI-o1, l’intelligenza artificiale che supera il modello dell’AI generativa per avvicinarsi all’AI generale. In sintesi – e con una frase che sa molto di spot – potremmo dire che si tratta di modelli in grado di ragionare e non soltanto di sintetizzare informazioni prese da database più o meno ampi. In sostanza, si dà una forma a quello che – soltanto qualche mese fa – veniva definito, all’interno degli ambienti di OpenAI, come progetto Strawberry, una sorta di nome in codice per parlare della tappa sin qui più ambiziosa a cui punta l’azienda di Sam Altman.

LEGGI ANCHE > La fragola che fa avvicinare pericolosamente OpenAI al ragionamento umano

OpenAI-o1, cos’è questo nuovo modello di AI che ragiona

È noto a tutti che ChatGPT, anche nella sua versione più recente (ovvero la numero 4), sia carente in matematica e in tutte le materie scientifiche. Secondo alcuni studi effettuati internamente direttamente da OpenAI, se ChatGPT-4 partecipasse alle olimpiadi della matematica, risponderebbe correttamente soltanto al 13% delle domande. Sicuramente, il modello di intelligenza artificiale generativa risponde a requisiti di rapidità e di efficacia nelle risposte a partire da prompt testuali che riguardano l’area umanistica (definiamola così per estensione), riesce a generare e a riconoscere immagini, ma è molto carente nelle discipline STEM, proprio perché queste ultime presuppongono un ragionamento, oltre che una sintesi e una rielaborazione.

OpenAI-o1 va proprio in questa direzione. Non è un caso se l’azienda fondata da Sam Altman abbia in qualche modo azzerato il contatore per definire questi modelli di intelligenza artificiale: il fatto di partire da una versione 1, infatti, indica sia la novità del progetto, sia i potenziali livelli di sviluppo che può raggiungere. Attualmente, lo stesso test per la risoluzione di quesiti sul tipo di quelli proposti alle olimpiadi della matematica dà come risultato un 83% di risposte positive, mentre OpenAI dichiara: «Le capacità di codifica [dei modelli OpenAI-o1] sono state valutate in concorsi e hanno raggiunto l’89° percentile nelle competizioni Codeforces».

La capacità di ragionamento di OpenAI-o1 permette anche di migliorare gli standard di sicurezza fin qui garantiti da OpenAI. Al momento, però, i modelli non sono in grado di ragionare su materiali multimediali come fotografie e video; inoltre, proprio per la natura stessa del tipo di elaborazione effettuata, le loro risposte non arrivano praticamente in tempo reale (come avviene per ChatGPT-4, ad esempio), ma impiegano più tempo per essere progettate e restituite all’utente.

Le prospettive di OpenAI-o1

«o1 – spiega OpenAI – può essere utilizzato dai ricercatori sanitari per annotare i dati di sequenziamento cellulare, dai fisici per generare formule matematiche complesse necessarie per l’ottica quantistica e dagli sviluppatori in tutti i campi per creare ed eseguire flussi di lavoro multi-step». Insomma, i modelli di AI che si avvicinano all’intelligenza artificiale generale sono concepiti per dare una svolta al mondo delle discipline scientifiche.

L’erede del progetto Strawberry, ovviamente, rappresenta un primo passo, anche perché c’è bisogno di tempo per migliorarlo e farlo migliorare anche a partire dal feedback dei suoi utenti. Già è stata pensata – ed è disponibile – una versione OpenAI-01 mini, adatta in modo particolare ai developer che utilizzano linguaggi di programmazione. Attualmente, chi ha a disposizione ChatGPT Plus e Team può inviare 30 messaggi per o1-preview e 50 per o1-mini ogni settimana. In futuro, OpenAI lavorerà per consentire un numero più alto di richieste da rivolgere ai suoi modelli. Inoltre, si sta già lavorando affinché questi stessi modelli possano essere più rapidi nelle loro risposte e possano essere in grado di lavorare anche attraverso immagini e video.

Share this article
TAGS