Quali sono i limiti attuali di OpenAI o1

Anche se i risultati sono (pericolosamente) sorprendenti, ci sono ancora molte cose da migliorare

13/09/2024 di Enzo Boldi

Ha ancora allucinazioni, ma dicono che migliorerà. È più lento degli altri modelli di linguaggio, ma questo non vuol dire che sia un enorme difetto. Ha ancora tanto da imparare, quotidianamente, vista la natura stessa di un’intelligenza artificiale “in grado di ragionare”. Dopo aver svelato i dettagli di quello che – fino a qualche settimana fa – era conosciuto come “progetto Strawberry“, OpenAI ha messo a disposizione degli utenti (non tutti) il nuovo prodotto di punta chiamato “o1”. Si tratta del primo reale contatto con un’AI che dovrebbe essere in grado di effettuare dei ragionamenti. Insomma, il futuro che sembrava essere lontanissimo (con annesse preoccupazioni) è già arrivato.

LEGGI ANCHE > OpenAI ha ufficialmente lanciato la sua intelligenza artificiale in grado di ragionare

Come abbiamo spiegato nel nostro precedente approfondimento, le varie versioni di OpenAI o1 messe a disposizione degli utenti abbonati fanno parte di una grande famiglia di modelli linguistici basati su sistemi di intelligenza artificiale. Soluzioni che – a differenza dei “fratelli minori” che hanno alimentato ChatGPT e GPT-4o, sono molto ferrati nelle cosiddette materie “STEM”. Dunque, parliamo di un modello in grado di effettuare ragionamenti più profondi, riducendo – e non di poco – quegli errori che prima venivano commessi nel campo della matematica e delle scienze.

OpenAI o1, quali sono i limiti attuali

Ovviamente ci troviamo nelle fasi iniziali del lancio, con un sistema che dovrà essere costantemente migliorato. Tra i limiti attuali, infatti, troviamo una grande lacuna: a differenza di GPT-4o, questa famiglia di modelli non è ancora in grado di navigare in internet, prendere informazioni (anche attuali) dal web e – soprattutto – non ha ancora la possibilità di analizzare i file. Dunque, parliamo di limitazioni piuttosto importanti che si aggiungono anche a un tempo di “ragionamento” superiore rispetto a molte altre soluzioni AI (parliamo di strumenti e servizi che agiscono a livello testuale, non di quelli in grado di generare immagini) presenti attualmente sul mercato.

Anche per via della complessità delle materie al centro di o1, il tempo di risposta a un prompt (che devono essere ben strutturati) è molto maggiore rispetto agli altri strumenti AI. Questo, però, non vuol dire che la risposta sarà certamente affidabile al 100%. Infatti, un documento ufficiale di OpenAI ammette altri difetti che rendono questa intelligenza artificiale ancora molto poco affidabile. In sintesi: questo modello tende ad avere ancor più allucinazioni rispetto al precedente (GPT-4o) e – spesso e volentieri – non è in grado di ammettere (nonostante il fulcro sia il “ragionamento”) di non avere risposte alle domande poste dall’utente.

Share this article
TAGS