In che modo Meta usa i nostri dati per la sua AI generativa

Nell’era in cui tutto chiama “intelligenza artificiale”, Meta è pronta a far sbarcare in Europa e nel Regno Unito la sua AI. Un progetto di cui si parla da tempo. E, parallelamente, quando si fa riferimento alla gestione della privacy da parte dell’azienda di Mark Zuckerberg, è necessario andare a scavare nei cavilli (anche per evitare un nuovo caso Cambridge Analytica e similari). Per questo motivo, proviamo a capire quali sono le informazioni sugli utenti che Instagram e Facebook utilizzeranno (perché le hanno già raccolte) per addestrare la sua AI generativa.

Partiamo dalla definizione che Meta dà della propria intelligenza artificiale generativa che – secondo quanto previsto dall’entrata in vigore della nuova informativa sulla privacy – dovrebbe sbarcare in Europa e nel Regno Unito dal prossimo 26 giugno:

«Consente alle persone di creare rapidamente contenuti in modi nuovi ed entusiasmanti. Ad esempio, con l’IA generativa le persone possono creare facilmente nuovi contenuti, come immagini da condividere con gli amici, mentre le aziende possono generare risposte testuali alle domande dei clienti».

Dunque, si tratta dello sviluppo di modelli informatici AI che saranno utili per la creazione di immagini e testi. Ma quali sono i dati e le informazioni che Meta raccoglierà dai nostri account (a meno che l’utente non decida di non consentire all’azienda di raccoglierli)?

Meta AI, in che modo usa i nostri dati per l’addestramento

La spiegazione ufficiale arriva dalla stessa azienda di Menlo Park che sottolinea come solamente una parte (la maggioranza) delle nostre informazioni possono essere escluse dal “trattamento per legittimo interesse” compilando e inviando il modulo “right to object” presente all’interno della piattaforma (ai sensi dell’articolo 21 del GDPR). Questo è un aspetto abbiamo analizzato in un altro approfondimento, perché ora ci concentriamo su quali dati vengono utilizzati per l’addestramento di Meta AI.

«Utilizziamo dati pubblicamente disponibili online e informazioni concesse in licenza. Inoltre, usiamo le informazioni condivise nei Prodotti e servizi di Meta, ad esempio post, foto e relative didascalie […] Per addestrare i nostri modelli raccogliamo informazioni pubbliche da Internet o dati concessi in licenza da altri fornitori; queste informazioni possono includere dati personali. Ad esempio, se raccogliamo informazioni da un post pubblico su un blog, questo potrebbe includere il nome dell’autore e le sue informazioni di contatto. Quando riceviamo informazioni personali all’interno dei dati pubblici o concessi in licenza che utilizziamo per addestrare i nostri modelli, non colleghiamo questi dati in modo specifico a nessun account Meta».

Insomma, di tutto e di più: post, immagini, descrizioni di foto e video. Tutti questi dati finiranno nel grande calderone del machine learning targato Meta per sviluppare costantemente la propria intelligenza artificiale generativa.

Cosa non viene utilizzato

Per fortuna, a detta di Meta, qualcosa dovrebbe rimanere fuori da questa raccolta. In particolare, si fa riferimento ai messaggi privati che – spesso e volentieri – contengono le informazioni più private e intime dei possessori di un account su tutte le piattaforme dell’ecosistema dell’azienda di Menlo Park:

«Non utilizziamo i contenuti dei messaggi privati che scambi con familiari e amici per addestrare le nostre intelligenze artificiali».

Non viene fornita una spiegazione più dettagliata di ciò, ma possiamo ricostruire questa “esclusione” dall’addestramento di Meta AI: non saranno utilizzate le nostre chat su Messenger, i Direct Messages (DM) su Instagram e le nostre chat Whatsapp. Il motivo è piuttosto semplice: si tratta di chat con crittografia end-to-end.