OpenAi accusata di rubare dati per la formazione di ChatGpt

OpenAi, l'organizzazione che sviluppa il chatbot ChatGpt, avrebbe utilizzato dati privati e informazioni protette dal diritto d'autore per "formare" il suo servizio di intelligenza artificiale.

Lo affermano i sottoscrittori di una causa intentata presso il tribunale federale di San Francisco, che propone un'azione collettiva per l'abuso di opere e creazioni, "usate impropriamente e con violazione del copyright" per l'addestramento di ChatGpt.

Come riporta Reuters sul suo sito, i principali fautori della causa sono due scrittori del Massachusetts, Paul Tremblay e Mona Awad, che hanno affermato come ChatGpt abbia estratto i dati copiati da migliaia di libri senza autorizzazione, violando i diritti di una vasta gamma di autori. Le accuse sono contenute in un documento di 157 pagine in cui si parla di danni potenziali per 3 miliardi di dollari.

"Nonostante vi siano protocolli consolidati per l'acquisto e l'uso di informazioni personali in rete, qui è stato adottato un approccio diverso: il furto" affermano i querelanti. Nel mirino c'è anche Microsoft, che ha investito diversi miliardi di dollari in OpenAi, citata in giudizio come imputata. La base legale di quella che potrebbe diventare una class action è il Computer Fraud and Abuse Act. Si tratta di una legge federale che si occupa di pirateria informatica, tirata in ballo per il cosiddetto "scraping" di informazioni, ossia l'utilizzo di una certa mole di dati disponibile online senza aver ottenuto il permesso dei proprietari. OpenAi viene accusata anche di violazione della privacy e dell'Electronic Communications Privacy Act, oltre che furto e arricchimento illecito dei suoi strumenti digitali. Tremblay e Awad spiegano che i libri sono un "ingrediente chiave" nel campo dell'IA generativa, perché offrono "i migliori esempi di scrittura di alta qualità". La denuncia stima in 300.000 libri le fonti di formazione di ChatGpt, inclusi quelli provenienti da "biblioteche online illegali" che offrono testi protetti da copyright senza autorizzazione.