Come sono strutturati i siti italiani generati con l’AI?
Che tipi di notizie vengono affrontati in questi siti generati tramite AI in lingua italiana e, in generale, come si possono riconoscere? Ne abbiamo individuato le caratteristiche principali
10/07/2023 di Ilaria Roncone
La rete di siti che inaffidabili generati tramite AI che operano in lingua italiana è stata identificata da Newsguard che, nella pagina in cui spiega quello che è emerso, fa anche i nomi. Di cosa si parla su questi siti e come sono strutturati? Come guadagnano (se lo fanno) e perché sono stati creati? Analizzandoli uno per uno proveremo, in questo articolo del monografico di Giornalettismo di oggi, a capire cosa hanno in comune tra loro e come funzionano i siti generati con AI.
LEGGI ANCHE >>> La più grande rete di siti italiani “inaffidabili” generati interamente dall’AI
Siti generati con AI in lingua italiana: i dati
Il report fornisce una serie di numeri e di indicazioni che ci parlano di un fenomeno che deve essere monitorato poiché, per ciò che emerge finora, siamo in una fase di testing e di creazione di questo topo di reti. Si tratta di una rete di siti che forniscono informazioni inaffidabili su tutta una serie di materie e che sono collegati tra loro, i cosiddetti UAIN (Unreliable AI-Generated News’ o ‘UAIN) che avevamo già analizzato in precedenza.
Il numero di questi siti creati con l’intelligenza artificiale e non supervisionati in nulla o in ben poco da esseri umani stanno aumentando: il Centro di monitoraggio sull’AI di Newsguard è passato da 49 a 301 siti solo nell’ultimo mese. Questi siti si identificano anche – tra le altre cose – perché nei contenuti prodotti al loro interno di trovano diversi messaggi di errore tipici dei chatbot e procedono pubblicando con regolarità contenuti di bassa qualità.
Di cosa parlano? Gli argomenti sono i più disparati: ci sono notizie vecchie che vengono fatte passare per recenti (“Downton Abbey: il nuovo film è finalmente su Netflix!”, che non è nuovo ma è del 2019); contenuti falsi su personaggi pubblici che presentano titoli ingannevoli (e con errori già nel titolo, come nel caso di “Svelato l’identità del misterioso marito di Paola Turci”, che non è sposata con un uomo ma unita civilmente con Francesca Pascale dall’estate 2022); rimedi per la perdita di peso che non hanno nulla di scientificamente provato (“Tisana all’ortica: il rimedio naturale per dimagrire rapidamente”).
Come sono strutturati questi siti: l’analisi
Si tratta di una serie di siti – come abbiamo già accennato – interconnessi tra loro che presentano grafiche simili e i cui contenuti possono essere ricondotti a un solo autore oppure non hanno nomi a firma. Si parla di fitness, di gossip, di salute, di meditazione. Tutti i siti presi in esame da Newsguard sono stati contatti agli indirizzi di contatto disponibili – se resi noti – ma in nessun caso il centro di monitoraggio ha ricevuto risposte.
In un caso specifico, i siti che presentano articoli firmati da un autore con nome, cognome e a volte anche una faccia sono comunque riconducibili all’AI. Lo sono le biografie, scritte con un tone of voice preciso e sempre identico, e lo sono le immagini, che vedono tale Valentina Bianchi Greco – autrice di 75 articoli sul sito Lunumi.com – aver caricato sul sito una foto profilo presa dal sito di immagini stock Pexels.com.
Per inquadrare meglio la questione abbiamo analizzato le ultime notizie di alcuni dei siti presi in esame, la maggior parte dei quali hanno nomi simili tra loro. Mybetterlife.style vede come ultimo articolo “Dopo 14 giorni di quarantena: il tampone diventa obbligatorio!”, che veicola una notizia inesistente ma che – per quel titolo – attira sicuramente l’attenzione di chi finisce nella home di questo sito. Cliccando sul nome dell’autrice, tale Giuliana Marchetti, si viene rimandati a una pagina che pubblicizza un sito di lettura di carte passando prima per un video di pubblicità del servizio su Youtube.
C’è Sasetu.com, che veicola notizie di lifestyle e benessere nominando diverse marche di scarpe e tinte per capelli, per esempio, e fornendo sempre un collegamento diretto a tutorial e video Youtube che parlano delle tematiche affrontate negli articoli. Articoli che, in tutti i casi, presentando linguaggio e strutture tipici di ChatGPT che puntano a ottenere il migliore risultato SEO possibile (ovvero mettono in pratica tutti quei trucchi e quei consigli che servono per far posizionare bene gli articoli sui motori di ricerca).
La stesura da parte dell’intelligenza artificiale non è evidente solo perché, a tratti, compaiono messaggi scritti dall’AI con palese intento pubblicitario (in un articolo, per esempio, il primo punto sulla lista di vantaggi di una determinata marca di tarocchi recita: «Personalizzazione: rispetto ai tarocchi XXX (omettiamo volutamente il nome n.d.R.), l’utilizzo di un assistente virtuale come Generale può offrire una maggiore personalizzazione dell’esperienza di lettura divinatoria. Generale può essere programmato per interagire con l’utente in modo specifico, fornendo consigli e suggerimenti personalizzati sulla base delle sue risposte») o perché a volte l’AI afferma di non potersi esprimere su determinate questioni. Ci sono anche articoli che passano da una lingua all’altra (prima in italiano, poi in inglese) senza una ragione apparente.
Altri nomi di siti di questo tipo sono: Sabonu.com, Boluno.com, Vatolu.com, Seolu.com, Lunumi.com. Gli schemi che abbiamo individuato in questo articolo si ripetono per tutti questi portali.