Sblocca gratuitamente il Digest dell’editore
OpenAI ha affermato che il New York Times ha “manipolato intenzionalmente” il suo chatbot per rigurgitare intere righe dagli articoli del giornale, mentre combatte una causa sul copyright da parte del giornale che rappresenta una minaccia per il modo in cui sviluppa la sua tecnologia.
La causa, intentata subito dopo Natale, era “priva di merito”, secondo un post sul blog pubblicato lunedì dalla società di intelligenza artificiale, in cui si aggiungeva che il giornale non stava “raccontando tutta la storia”.
Nella causa intentata il 27 dicembre, la società mediatica americana ha accusato la start-up di intelligenza artificiale e il suo principale sostenitore, Microsoft, di aver fatto un “viaggio gratis” utilizzando milioni di articoli per costruire la sua tecnologia chatbot, in grado di rispondere in dettaglio ai naturali suggerimenti linguistici.
Il copyright è una questione sempre più spinosa per le aziende di intelligenza artificiale come OpenAI, i cui modelli funzionano acquisendo enormi quantità di dati da Internet. La causa, che chiede miliardi di dollari di risarcimento danni, sostiene che OpenAI ha tratto profitto dallo “sfruttamento e dall’appropriazione indebita della proprietà intellettuale del Times”.
A ciò è seguita la proposta di un’azione collettiva da parte di una coppia di autori di saggistica, che sostengono che OpenAI ha violato il loro diritto d’autore addestrando il suo ampio modello linguistico sul loro lavoro. Notevoli autori di narrativa, tra cui John Grisham e Jodi Picoult, avevano già intentato una causa simile.
Nel suo blog, OpenAI afferma di aver sentito parlare per la prima volta della causa del Times da un articolo pubblicato dal giornale il 27 dicembre. Prima di ciò, afferma, era stata impegnata in discussioni produttive con l’organizzazione dei media su una partnership, e aveva ha spiegato che il Times “i contenuti non hanno contribuito in modo significativo alla formazione dei nostri modelli esistenti”.
Nel caso del copyright, il Times ha affermato che il chatbot di OpenAI aveva rigurgitato interi estratti dei suoi articoli, un fenomeno descritto da OpenAI come “memorizzazione involontaria”, che la società ha esplicitamente tentato di evitare.
Il Times ha inoltre invitato OpenAI a distruggere tutti i dati di addestramento e i modelli di chatbot che avevano utilizzato il suo materiale protetto da copyright.
Secondo OpenAI, gli esempi proposti dal Times provengono da vecchi articoli che sono stati pubblicati su numerosi siti di terze parti. “Sembra [the Times] suggerimenti manipolati intenzionalmente, spesso contenenti lunghi estratti di articoli, al fine di far rigurgitare il nostro modello.
“I nostri modelli in genere non si comportano come insinua il New York Times, il che suggerisce che abbiano istruito il modello a rigurgitare o abbiano selezionato i loro esempi da molti tentativi”, ha scritto OpenAI.
OpenAI e altre società di intelligenza artificiale hanno sostenuto che l’elaborazione di risme di dati disponibili al pubblico da Internet costituisce un “fair use” protetto dalla legge statunitense sul copyright.
Il conflitto nasce quando OpenAI cerca di stringere una serie di accordi con altre testate giornalistiche per concedere in licenza i loro contenuti. All’inizio di dicembre, la società ha raggiunto un accordo storico con l’editore tedesco Axel Springer, del valore di decine di milioni di euro all’anno, che potrebbe fornire un modello per futuri legami tra editori e società di intelligenza artificiale.
“Riteniamo che la causa del New York Times sia priva di merito. Tuttavia, speriamo in una partnership costruttiva con il New York Times e rispettiamo la sua lunga storia”, ha scritto OpenAI nel blog di lunedì.
Il New York Times non ha risposto immediatamente a una richiesta di commento.