OpenAI viola il copyright dei romanzi? La causa di due scrittori Usa

ChatGPT è accusata di violare la legge sul copyright per addestrare il suo algoritmo. Due scrittori americani hanno fatto causa al chatbot di OpenAI in quanto ritengono che abbia analizzato e riassunto centinaia di libri senza chiedere il consenso degli autori. Ad alzare la voce sono stati Mona Awad e Paul Tremblay che ha scritto The Cabin at the End of the World, poi adattato al cinema nel film Bussano alla porta. Già a gennaio l’agenzia fotografica Getty Images aveva mosso le stesse accuse contro Stable Diffusion, generatore di arte basato sull’IA.

ChatGPT analizzerebbe centinaia di libri senza il consenso degli autori per addestrare l’algoritmo. Nessuna risposta da OpenAI e Microsoft.
Alcuni volumi sugli scaffali di una libreria (Imagoeconomica).

LEGGI ANCHE: Intelligenza artificiale, l’appello di mille esperti: «Stop allo sviluppo di ChatGPT»

In che modo ChatGPT di OpenAI avrebbe violato la legge sul copyright nell’editoria

Come ha sottolineato l’Hollywood Reporter, nel 2018 OpenAI ha alimentato GPT-1, prima versione del suo chatbot, con circa 7 mila romanzi su BookCorpus. Si trattava di una raccolta letteraria assemblata ad hoc da un team di esperti di intelligenza artificiale per creare un modello di linguaggio di grandi dimensioni. «Hanno copiato i libri dal sito Smashwords.com che ospita romanzi inediti disponibili gratuitamente per i lettori», hanno detto Awad e Tremblay. «Quei romanzi però sono in gran parte protetti da copyright». Per l’accusa, ChatGPT ha copiato i dati «senza consenso, credito o compenso per i suoi autori». Un fenomeno che si sarebbe ulteriormente allargato nel 2020 per GPT-3, la versione precedente a quella attuale.

ChatGPT analizzerebbe centinaia di libri senza il consenso degli autori per addestrare l’algoritmo. Nessuna risposta da OpenAI e Microsoft.
Uno screenshot del chatbot ChatGPT di OpenAI (Getty Images).

Come dichiarato dalla stessa OpenAI, il 15 per cento dei dati per addestrare l’algoritmo era frutto di «due corpora di libri», definiti semplicemente “Books1” e “Books2”. Secondo l’accusa, i romanzi provenivano da biblioteche ombra illegali, tra cui Library Genesis, Bibliotik e Z Library, sito pirata chiuso nel 2022. Tramite queste piattaforme, ChatGPT avrebbe avuto accesso a circa 300 mila volumi bypassando il consenso dei rispettivi autori. Dopo un periodo di addestramento, il chatbot potrebbe adesso anche generare riassunti molto accurati di tutti i romanzi, favorendo la diffusione illegale delle opere. Contattate da Reuters né OpenAI né Microsoft, che possiede parte della società, hanno ancora rilasciato commenti a riguardo.

LEGGI ANCHE: AI Act, approvato dal Parlamento Ue il regolamento sull’intelligenza artificiale

Powered by WordPress and MasterTemplate