L’indagine del Garante della privacy sui dati raccolti per «educare» gli algoritmi

L'obiettivo è quello di evitare il più possibile l'attività di webscraping a maggior ragione da siti pubblici

25/11/2023 di Redazione Giornalettismo

Occhio al webscraping. Chi abitualmente legge Giornalettismo sa bene che si tratta di quella pratica a partire dalla quale vengono “raschiati” migliaia e migliaia di dati disponibili pubblicamente su internet. I più attenti ricorderanno anche che il webscraping è stato al centro di uno dei più grandi scandali moderni che hanno riguardato i nuovi media (avete presente Cambridge Analytica e l’utilizzo improprio per fini elettorali dei dati di milioni di utenti di Facebook?). Il webscraping è un’attività che, in qualche modo, ha trovato una nuova linfa in tempi recenti, con il grande sviluppo degli strumenti di intelligenza artificiale. Il famoso “addestramento” di questi strumenti passa attraverso l’analisi di un grande quantitativo di dati personali, che – nella maggior parte dei casi -, essendo disponibili pubblicamente, vengono utilizzati senza particolari problemi. Per questo motivo, il Garante della Privacy ha deciso di indagare su questo fenomeno, per assicurarsi che tutto avvenga in maniera regolare e senza violazioni.

LEGGI ANCHE > Il grosso guaio del software gestionale usato da 7mila medici italiani

Garante sul webscraping, l’indagine

L’indagine del Garante riguarda tutti i soggetti che sono stabiliti in Italia e che offrono servizi nel nostro Paese. Questi ultimi mettono a disposizione online i dati personali degli utenti, che possono essere consultati anche da quegli strumenti – gli spider – che vengono utilizzati da chi addestra gli algoritmi dell’intelligenza artificiale. Si tratta di un’indagine preliminare, che punta a cogliere il suo problema dalla radice, per evitare che si possa diramare in maniera troppo veloce e, quindi, incontrollabile.

Ora, le varie associazioni di categoria, gli esperti e gli accademici dovranno necessariamente dare un proprio contributo a questa esplorazione. Ci sono 60 giorni di tempo per proporre iniziative e soluzioni per supportare l’attività dell’autorità. Con una spada di Damocle che pende sulle teste di ciascuno: se la situazione dovesse in qualche modo sfuggire di mano – e se i dati personali dovessero risultare a rischio – l’autorità si riserva di intervenire d’urgenza.

Share this article