Siamo sicuri che Sora sia un passo verso il futuro?

Il nuovo strumento di intelligenza artificiale di OpenAI porta la discussione a un nuovo livello: stiamo parlando del text-to-video e dei suoi effetti sulla società

26/02/2024 di Gianmichele Laino

C’è stato un tempo in cui ci meravigliavamo tantissimo di come una intelligenza artificiale potesse interagire con noi a partire da scambi di battute a livello testuale. Poi, è arrivato il momento in cui ci dichiaravamo stupiti che un’intelligenza artificiale, a partire da un prompt di testo, potesse addirittura riprodurre un’immagine, aprendo la strada a quel dominio del visual che tanto, oggi, rischia di influenzare la nostra presenza online. Oggi, siamo arrivati al momento di restare a bocca aperta di fronte a uno strumento di AI che, sempre a partire da un prompt di testo, è in grado di riprodurre un video, accurato e abbastanza realistico (almeno nei test ufficiali proposti). In tutti e tre i casi, a fare da pioniere verso quella che ormai sembra una rivoluzi indetamente il settore della produzione video.

LEGGI ANCHE > Come sono i nuovi equilibri interni a OpenAI dopo il balletto di Altman

Sora, come funziona l’intelligenza artificiale text-to-video

Sora ha messo sul chi va là tutti gli attenti osservatori delle ultime novità digitali. In effetti, i video demo mostrati da OpenAI sembrano essere assolutamente realistici: una camminata tra le strade di Tokyo, dei mammuth che si muovono tra i ghiacci, una dronata su una scogliera con il mare agitato, sono sono alcuni degli esempi che OpenAI ha fornito al mondo per far capire di cosa sia realmente capace il suo nuovo strumento di intelligenza artificiale. Tuttavia, al di là delle immagini utilizzate a scopo di marketing, Sora non è ancora un prodotto pronto a essere immesso sul mercato. Chi lo ha testato in maniera indipendente ha avuto modo di osservarne anche i limiti e di dimostrare come, in realtà, sia abbastanza impreciso nella descrizione di alcune scene. Insomma, al momento non sembra possano esserci rischi di confusione tra un video generato dall’intelligenza artificiale e un video girato dal vivo, al di là del dibattito sull’efficacia di un watermark che possa individuare – a tutti i livelli – i prodotti visuali e multimediali generati attraverso strumenti di AI.

Al momento, gli esperti che stanno cercando di evidenziare tutti i bias di Sora ritengono che ci siano ancora delle problematiche sui cosiddetti effetti particellari e che ci siano ancora delle scorrette interpretazioni dei prompt testuali, che portano gli strumenti di intelligenza artificiale a realizzare delle scene fisicamente impossibili, che hanno un po’ l’effetto volutamente straniante creato da un film come Poor Things, per intenderci. Del resto, lo stesso OpenAI ha dichiarato che lo strumento è ancora a una fase embrionale: tra gli esempi forniti, non ci sono soltanto quelli perfetti, ma anche quello di un uomo che corre sul tapis roulant nel verso opposto rispetto a quello che normalmente dovrebbe percorrere.

Pensare al futuro: che destino avranno i video girati dal vivo rispetto a quelli prodotti con l’AI

Tuttavia, uno strumento di questo tipo ha ampi margini di miglioramento. E sarà inevitabile che, a un certo punto, Sora possa essere utilizzato in maniera abbastanza diffusa e con risultati decisamente più precisi rispetto a quelli mostrati in questa fase di test. Sarà allora un problema per le maestranze della produzione video, che saranno sempre più messe ai margini dagli imprenditori, che avranno – a quel punto – a disposizione uno strumento in grado di produrre ottimi risultati a un basso costo.

Ma sarà un problema soprattutto per quanto riguarda la percezione della realtà da parte degli utenti che, sulle piattaforme digitali, avranno sempre maggiori difficoltà nel comprendere quando un video possa essere frutto di un fatto realmente accaduto e quanto, invece, possa essere invece frutto dell’intelligenza artificiale.

Questo aspetto è stato recentemente analizzato anche da Sam Gregory, direttore dell’ong WITNESS. Su Linkedin, il numero uno dell’associazione che si occupa di denunciare violazioni dei diritti umani a partire dall’analisi di alcuni video che vengono esaminati dalla stessa associazione ha messo in evidenza come – ad esempio – un fatto del genere possa essere alterato e compromesso dalla presenza, in giro, di video girati dall’intelligenza artificiale. «Nei video realistici di eventi mai accaduti – ha scritto -, ci mancherebbe la capacità di cercare il riferimento, la fonte originale. È quello che facciamo ora con una prima ricerca dei video falsi o delle immagini fake: utilizziamo una ricerca di immagini inversa per trovare l’originale, attraverso gli strumenti visuali che ci mette a disposizione Google».

Insomma, come vedremo nel monografico di oggi, esistono diversi motivi per essere molto preoccupati dall’uso (e dall’abuso) di uno strumento come Sora. E sappiamo anche che questa nuova piattaforma di AI sarà un forte attrattore anche per quelle aziende, di tutti i settori, che sono fortemente spinte a investire sul settore visuale. Per loro, Sora sarà una scappatoia. Che, però, va esattamente nella direzione opposta rispetto alla spinta originaria che chiede ai brand di investire sulle immagini e sulle produzioni originali.

Share this article
TAGS