Un po’ Siri, un po’ Alexa: ora ChatGPT vede, ascolta e parla
Nonostante molte problematiche ancora irrisolte sull'affidabilità, OpenAI ha proseguito lo sviluppo per rendere il chatbot sempre più multimodale
27/09/2023 di Enzo Boldi

Sono ancora tantissimi i problemi irrisolti dei vari strumenti di intelligenza artificiale a uso e consumo dell’utente medio. Nel monografico di oggi, per esempio, Giornalettismo ha raccontato il “caso” Fabrizio Gatti, il giornalista (direttore editoriale per gli approfondimenti di Today.it) “vittima” di uno scambio di persona da parte del chatbot sviluppato da OpenAI. Nonostante le perplessità sull’utilizzo incontrollato di un sistema instabile e non affidabile, l’azienda di Sam Altman sembra fare spallucce e pensare non tanto al miglioramento sulla ricerca delle fonti, ma sull’aumento dell’offerta da “vendere” agli utenti. Tra le novità di ChatGPT, infatti, c’è una sorta di modello “Siri” e “Alexa”.
LEGGI ANCHE > Bard vs ChatGPT: il “caso” Fabrizio Gatti secondo i due chatbot
Il 25 settembre, infatti, OpenAI ha annunciato l’introduzione di numerose novità relative all’app per iOS e Android: ChatGPT inizia a parlare, ascoltare e vedere. Tutte funzioni che, per il momento, erano elementi che caratterizzavano altre tipologie di prodotti creati e sviluppati da altre aziende (Apple e Amazon, per esempio).
«Voce e immagine ti offrono più modi per utilizzare ChatGPT nella tua vita. Scatta una foto di un punto di riferimento mentre viaggi e intrattieni una conversazione dal vivo su ciò che è interessante in esso. Quando sei a casa, scatta foto del tuo frigorifero e della dispensa per capire cosa c’è per cena (e fai domande di follow-up per una ricetta passo passo). Dopo cena, aiuta tuo figlio con un problema di matematica scattando una foto, cerchiando il problema impostato e chiedendogli di condividere suggerimenti con entrambi».
Le novità ChatGPT non sono per tutti. Come spiega il comunicato, si tratta di un aggiornamento che riguarderà esclusivamente gli utenti abbonati ai pacchetti Plus ed Enterprise. Inoltre, si tratta di funzionalità disponibile solamente in app (per iOS e Android).
Novità ChatGPT, ora vede, ascolta e parla
Di fatto, nello specifico si tratta di due nuove funzionalità che permetteranno al chatbot e all’utente di interagire in tre modi differenti:
- Capacità vocale: gli utenti potranno ora “dialogare” con ChatGPT utilizzando la voce, sia per fare domande che per ascoltare le risposte del chatbot.
- Capacità di analizzare immagini: gli utenti potranno scattare fotografie o caricare immagini all’interno dell’interfaccia, con il chatbot che (stando alle promesse) sarà in grado di comprenderne il contenuto e, di conseguenza, rispondere a domande relative allo scatto.
Una evoluzione rispetto a quello che, fino a ora, è stato un moto “tradizionale” di interagire e interfacciarsi con questo chatbot conversazionale, seguendo la linea di principio del comando (prompt) scritto e della risposta secondo le stesse modalità testuali.
La capacità vocale
Stando a quanto dichiarato da OpenAI, la capacità vocale di ChatGPT si basa sulla combinazione tra riconoscimento vocale e sintesi vocale. Dunque, il chatbot è in grado di ricevere un input in versione audio e di restituire una risposta alla domanda/comando utilizzando una voce sintetica femminile. Ovviamente, per fare questo basterà dare il consenso all’app affinché possa utilizzare il microfono dello smartphone per poter rendere funzionante questa opzione.
La capacità di analizzare immagini
Per quel che riguarda l’inserimento di input visivi, l’azienda di Sam Altman ha spiegato che la capacità di analisi delle immagini di ChatGPT pone le sue basi su un ampio dataset in cui si trovano sia immagini che testo. Questa funzionalità consentirà all’app chatbot AI di comprendere il contenuto di una foto (caricata o scattata dopo aver dato all’applicazione le autorizzazioni di rito) e rispondere a una o più domande relative a quello scatto. L’esempio citato dall’azienda americana è quella di un frigo: si potranno – stando alle promesse – scattare fotografie dei prodotti a disposizione (che saranno riconosciuti dall’intelligenza artificiale) e chiedere una ricetta ad hoc.