Decine di casi si stanno manifestando in queste ore, in seguito alla ricerca spasmodica di testate giornalistiche specializzate

Ci sono sempre stati. Ma adesso iniziano a passare di bocca in bocca, acquisendo una rilevanza maggiore che in passato. Vi ricordate Cambridge Analytica e il grande scandalo che aveva coinvolto Facebook nel 2018? Immaginate una sua replicazione periodica, non soltanto su questo social network, ma anche su tante altre piattaforme che utilizzano i nostri dati personali per funzionare. C’è uno spettro che si agita per il mondo, lo spettro del data scraping.

Perché il data scraping sta preoccupando così tanto le piattaforme social

Inizio del mese di aprile. Wired USA rivela una clamorosa fuga di dati partita proprio da Facebook: oltre 553 milioni di utenti coinvolti, mail e numeri di telefono che hanno circolato liberamente per il mondo, fino ad arrivare sulle chat e i gruppi di hacker su Telegram. Questa lista è stata talmente tanto sfruttata che, alla fine, veniva diffusa anche gratuitamente.

Qualche giorno dopo. Un’altra fuga di dati è partita dalle liste di LinkedIn. Ancora una volta, il problema aveva dimensioni importanti: 500mila account per almeno 780mila indirizzi mail e contatti di vario tipo. L’azienda che correva ai ripari affermando che i dati erano desunti da siti web di aziende e non direttamente dalla piattaforma.

Oggi, il caso Clubhouse. La scusa è sempre la stessa: nessuno ha bucato la piattaforma, semplicemente quei dati sono sempre rimasti a disposizione del pubblico che vi poteva risalire accedendo alla propria API. È bastato mettere insieme dei software per aggregare queste “pagine pubbliche” che “conservano” i nostri dati per raschiarle via (data scraping, appunto) e utilizzarli per scopi più vari (principalmente tentativi di truffe sempre più sofisticate, attraverso phishing e smishing).

Il ripetersi di questo tipo di fenomeni

Ormai, leggiamo una storia di questo genere al giorno. Il rischio è addirittura quello dell’assuefazione. Ma i danni d’immagine che, ogni volta, subiscono le piattaforme dalle quali vengono estrapolati i dati attraverso questo sistema in apparenza banale sono sempre sostanziosi. Ecco perché, a ogni occasione, si affrettano a smentire, magari dando le responsabilità all’utente che non avrebbe seguito correttamente le linee guida della piattaforma nell’inserimento dei propri dati personali.

Eppure, con la diffusione di una maggiore consapevolezza su questo tema (frutto di una sempre più necessaria e diffusa educazione informatica), il vaso di Pandora è scoperchiato. Non si può giocare con i dati personali degli utenti non rendendoli edotti dei rischi che questi ultimi corrono, fosse anche per azioni realizzate da terze parti che sfruttano database per cui gli utenti stessi hanno speso la propria autorizzazione. Il data scraping sta diventando il rompicapo degli sviluppatori delle piattaforme che si stanno adoperando, in questi ultimi giorni, per capire come fare a evitare l’onta di queste ripetute fughe di dati personali. È l’ultima sfida della sicurezza informatica.