Attualità

Cosa ci dicono i primi risultati di OpenAI-o1?

Questo modello di intelligenza artificiale che elabora modelli complessi è riuscito a ottenere risultati molto significativi nelle prove matematiche, classificandosi - tra le altre cose - tra i primi 500 studenti degli Stati Uniti

Studente modello o modello studente? In realtà OpenAI-o1 punta a essere entrambe le cose. Perché se i suoi risultati possono essere valutati sulla base di quegli indicatori che naturalmente vengono utilizzati per monitorare le prestazioni, a livello globale, delle migliori menti umane, è pur vero che questo modello di intelligenza artificiale non punta a essere fine a se stesso, ma a migliorare le prestazioni di dottorandi, di ricercatori, di docenti ed esperti in tutti i campi della scienza, dalla genetica all’informatica, dalle discipline applicate a quelle pure. Fino a questo momento, quando il prodotto ormai è stato lanciato per tutti gli utenti di ChatGPT Plus e Team, le valutazioni a disposizione sono soltanto quelle del team di sviluppo interno a OpenAI che, tuttavia, si è confrontato con alcune delle istituzioni più tradizionali e radicate nel mondo delle scienze matematiche. Una indicazione su tutte: secondo l’American Invitational Mathematics Examination, OpenAI-o1 si sarebbe classificato tra i primi 500 studenti di tutti gli Stati Uniti.

Risultati OpenAI-o1, le discipline in cui primeggia

Alla base di questi risultati – come abbiamo avuto modo di vedere – c’è un particolare tipo di apprendimento, che permette ai modelli di sviluppare un ragionamento, di sequenziare i problemi, di compiere operazioni matematiche e non soltanto di sintetizzare o di rielaborare grandi quantità di dati. È qualcosa di molto prossimo all’intelligenza artificiale generale, che punta a simulare il ragionamento umano e a riprodurne i risultati.

Sempre il board di OpenAI, a questo proposito, ha comunicato che – per quanto riguarda le discipline fisica, biologia e chimica – OpenAI-o1 è il primo modello di intelligenza artificiale ad aver raggiunto il livello di un dottorato di ricerca. Ha ottenuto risultati rilevanti sia nella classifica delle olimpiadi matematiche, sia nella classifica delle olimpiadi di informatica.

Come detto, OpenAI-o1 presenta ancora dei limiti. Tuttavia, il team di sviluppo è già al lavoro per superarli e per rendere lo strumento ancora più performante. Questo aspetto è evidentemente incredibile, se si pensa che già in questo momento, il modello ha ottenuto, ad esempio, un punteggio Elo di 1807, superando il 93% dei concorrenti umani. Il punteggio Elo, lo si ricorda, è quello applicato ai giocatori di scacchi, sulla base della probabilità di vittoria. I professionisti, ovviamente, si attestano intorno ai 2800 punti, mentre OpenAI-o1 supera di gran lunga il punteggio medio di un giocatore abituale. Ma, se si considerano le tempistiche di sviluppo e le potenzialità del modello, non ci vorrà poi molto a far diventare OpenAI-o1 (anche) un campione invincibile degli scacchi.