Ci risiamo. Come già accaduto in passato, soprattutto a OpenAI, un’altra startup che ha sviluppato chatbot conversazionali e modelli di linguaggio basati sull’intelligenza artificiale è finita nel mirino di una causa per violazione del diritto d’autore. Nei giorni scorsi, infatti, è stata depositata presso il Tribunale federale della California una denuncia per una class action nei confronti di Anthropic, l’azienda fondata dai fratelli italo-americani Daniela e Dario Amodei. A muovere le accuse sono stati tre autori che sostengono come il chatbot AI Claude sia stato addestrato utilizzando alcuni loro scritti senza chiedere il consenso e senza firmare un contratto di licenza d’utilizzo.

I tre autori – i nomi più noti di questa class action – sono Andrea Bartz, Charles Graeber e Kirk Wallace Johnsone la loro tesi è piuttosto semplice: il chatbot AI Claude sarebbe stato addestrato da un dataset open source chiamato “The Pile” al cui interno è presente una sezione denominata “Books3” che contiene una moltitudine di opere – anche di grandi autori come Stephen King – piratate e pubblicate senza rispettare il copyright. Stesso discorso varrebbe anche per un’altra fonte utilizzata da Anthropic per addestrate il suo chatbot come il portale “Bibliotik”, al cui interno ci sono una miriade di testi pubblicati in violazione del diritto d’autore. E la natura di questi due “dataset” è nota a molti e, secondo l’accusa, anche la startup di Claude ne era a conoscenza, ma ha attinto ugualmente da lì.

Class action contro Anthropic, cosa sta succedendo

Già in passato l’azienda dei fratelli Amodei era finito nel mirino delle critiche, come quando Universal Music, ABKCO e Concord Publishing citarono in giudizio – alla fine dello scorso anno – Anthropic per “uso improprio” dei testi musicali degli artisti. Non è un caso, infatti, che nella class action contro Anthropic avviata dai tre autori non si faccia riferimento solamente a una richiesta di rimborso economico per violazione del copyright. Si vuole obbligare la startup a evitare che utilizzi anche in futuro materiale coperto da diritto d’autore per addestrare i propri modelli.