La proposta di EGAIR (European Guild for Artificial Intelligence Regulation) alla Commissione UE per regolamentare l'utilizzo di lavori creativi e dati personali da parte delle aziende AI è chiara

Le richieste di EGAIR per la Commissione Europea sono chiare: un “training right” da inserire nell’ambito dell’AI Act per regolamentare lo sfruttamento dei dati e delle opere creative da parte delle società di AI. Chi sono quelli di EGAIR (che sta per IR, European Guild for Artificial Intelligence Regulation)? In breve – verrà approfondito poi in un altro dei pezzi del monografico di oggi – si tratta di un progetto a livello europeo che ha preso vita dall’iniziativa tutta italiana del fumettista Lorenzo Ceccotti e di MeFu – Mestieri del Fumetto (associazione che punta a valorizzare le opere di autrici e autori di fumetti).

L’obiettivo di EGAIR – che ha riunito i professionisti di tutti i settori creativi a livello europeo – è quello di intervenire sulla proposta di regolamento della Commissione Europea che tratta tematiche relative all’intelligenza artificiale (l’AI Act, appunto) poiché, attualmente, le implicazioni dell’utilizzo di app come Lensa AI non vengono considerate.

I presupposti sui quali si basa il manifesto di EGAIR

Il manifesto è presente sul sito di EGAIR in lingua inglese e sono disponibili, per ora, anche la versione francese, italiana e rumena. Non solo artisti e creativi, come si legge nell’introduzione del manifesto, ma anche editori e associazioni europei che si sono uniti per sottolineare «come i nostri dati e le nostre proprietà intellettuali stiano venendo sfruttati senza il nostro consenso e su una scala mai vista prima».

«Se anche tu credi che i tuoi dati personali e il frutto del tuo lavoro creative non debbano essere impunemente sfruttati per profitto da una manciata di società e multinazionali, unisciti a noi in questa battaglia», incita EGAIR spiegando la sua ragione di esistere come unione di persone, associazioni ed enti tutti danneggiati in egual misura dal massiccio utilizzo privo di regolamentazione fatto delle loro produzioni.

L’analisi fatta nel manifesto è precisa e puntuale. Partendo dal presupposto che nell’estate 2022 c’è stato un boom di tecnologie AI text-to-image (TTI) o image-to image, è emerso chiaramente come questo progresso poggi le basi sul lavoro creativo e sui dati personali di milioni di persone nel mondo. Per fare ciò che fanno, infatti, applicazioni come Lensa Ai, come Replika e come ChatGPT (e sono solo i nomi di alcune di quelle che hanno riscosso più successo) vengono addestrate sfruttando una enorme mole di dai personali e opere che realmente esistono e che appartengono, di diritti, a qualcuno.

La qualità del lavoro prodotto dipende dalla qualità del dataset sfruttato. «Per esempio, riguardo le immagini, più foto e illustrazioni vengono usate nell’addestramento di un’AI, più stili quell’AI potrà replicare e più cose potrà fare», scrive EGAIR. «Ne consegue che i prodotti venduti dalle società di AI sono il risultato di operazioni su dataset, i quali contengono ogni tipo di dato, inclusi milioni di immagini coperte da copyright, foto private e altro materiale sensibile. Questi sono stati raccolti attraverso un’operazione di scraping indiscriminato di tutto il web, senza alcun consenso da parte dei proprietari e delle persone rappresentate e stanno venendo utilizzati dalle società di AI per trarne profitto», conclude l’associazione.

L’appello all’Unione Europea: i cinque punti

Nelle parole scritte sul manifesto l’appello a coloro che possono regolamentare la questione è chiaro: «Ogni volta che viene sviluppata una tecnologia così rivoluzionaria, la nostra società deve monitorare il suo sviluppo» e «questo non è ancora accaduto con la tecnologia AI». La rivoluzione cui porta l’utilizzo sempre più massiccio di queste tecnologie – dal mondo del lavoro al mondo della produzione di contenuti – la stiamo già vedendo.

Ciò che manca è una regolamentazione efficace che si occupi e si preoccupi di dare la giusta direzione – e porre degli argini – alla rivoluzione. La proposta dell’European Guild for Artificial Intelligence Regulation pone le sue basi su cinque specifiche richieste che dovrebbero essere prese in considerazione dagli enti regolatori europei. Nel primo punto viene chiesto che tutti i dati relativi a persone e opere, in qualunque forma esistano (dal testo all’audio, dal video alle immagini, creati e catturati in qualsiasi modo) non vengano utilizzati per il training delle AI «senza l’esplico consenso informato dei loro legittimi proprietari».

L’utilizzo di nomi, nomi d’arte, opere, video, immagini, suoni e testi che non siano coperti da una licenza di sfruttamento per il training di AI «deve essere proibito ai software che consentono di inserirli per generale un’immagine, video, testo o suono» (e questi sono il secondo e il terzo punto del manifesto). La richiesta prosegue con il punto quattro, in cui si specifica che diciture come “interamente generato con AI” e ” realizzato utilizzando materiale generato con AI” dovrebbero diventare lo standard così da rendere chiara e inequivocabile la provenienza del prodotto.

Una menzione a parte, infine, viene fatta per quelli che sono considerabili dati personali degli utenti che – proprio come il materiale frutto di lavoro creativo – finiscono nei dataset dati in pasto all’AI. Se da un lato abbiamo la legge sul copyright e dall’altro abbiamo quella sulla privacy, il punto è che – alla fine dei conti – «ogni singolo dato che viene inserito nei modelli di training deve essere curato e autorizzato dai legittimi proprietari e quindi inserito in maniera volontaria e informata dai singoli autori».