Sblocca gratuitamente il digest dell'editore
Meta combatterà un gruppo di autori statunitensi in tribunale giovedì in uno dei primi grandi test legali se le aziende tecnologiche possano utilizzare materiale protetto da copyright per formare i loro potenti modelli di intelligenza artificiale.
Il caso, che è stato portato da circa una dozzina di autori tra cui Ta-Nehisi Coates e Richard Kadrey, è incentrato sull'uso di Libgen da $ 1,4 Tn di social media, una cosiddetta biblioteca ombra di milioni di libri, articoli accademici e fumetti, per addestrare i suoi modelli Llama AI.
La sentenza avrà implicazioni di vasta portata nella feroce battaglia del copyright tra artisti e gruppi di intelligenza artificiale ed è una delle fluttuazioni di cause legali in tutto il mondo che sostengono che i gruppi tecnologici stanno usando contenuti senza permesso.
Microsoft, Openi e Antropic affrontano anche simili sfide legali rispetto ai dati utilizzati per addestrare i modelli di grandi dimensioni dietro i loro popolari chatbot AI, come Chatgpt e Claude.
“I modelli di intelligenza artificiale sono stati addestrati su centinaia di migliaia se non milioni di libri, scaricati da noti siti piratati, questo non è stato accidentale”, ha affermato Mary Rasenberger, amministratore delegato della Authors Guild. “Gli autori avrebbero dovuto ottenere commissioni di licenza per questo.”
Meta ha sostenuto che l'uso di materiali protetti da copyright per formare LLMS è “equo uso” se viene utilizzato per sviluppare una tecnologia trasformativa, anche se proveniente da database piratati. Libgen ospita gran parte del suo contenuto senza permesso dei detentori dei diritti. Nei documenti legali, Meta rileva che “l'uso era equo indipendentemente dal suo metodo di acquisizione”.
Secondo i documenti del tribunale, il gigante della tecnologia degli Stati Uniti si è impegnato in prime discussioni con gli editori di libri che esplorano le opzioni per autorizzare il materiale per formare i suoi modelli. I querelanti sostengono che Meta lo ha abbandonato perché le opere erano disponibili tramite Libgen, portando a una perdita di compensazione e controllo per gli autori.
Nella scoperta, Meta disse: “Se la licenza una volta [sic] Libro singolo, non saremo in grado di appoggiarci alla strategia di uso equo ”. Meta sostiene nella sua difesa che non vi era un mercato per la licenza di tali opere per questo scopo.
Tuttavia, le e -mail scoperte nel processo di scoperta della Corte mostrano meta dipendenti che suggeriscono che stavano entrando in un'area grigia legale e sembrando discutere su come evitare il controllo quando si utilizzano Libgen, secondo i documenti di reclamo.
In una e -mail di gennaio dello scorso anno, Joelle Pineau, il capo della Fiera di Research Lab di recente, recentemente scomparsa di Meta, ha raccomandato di utilizzare il set di dati Libgen.
In una successiva e -mail, Sony Theakanath, direttore del prodotto di Meta, ha dichiarato “in nessun caso rivelare pubblicamente che ci eravamo formati su Libgen”. L'e -mail aveva un sottotitolo “rischio legale”, in cui i rischi o i dettagli di seguito sono stati redatti, così come un altro sottotitolo “rischi politici”, che conteneva “copyright e IP”. L'e -mail ha suggerito mitigazioni come “rimuovere i dati chiaramente contrassegnati come piratati/rubati”.
Il caso arriva mentre Meta sta versando miliardi di dollari per diventare un “leader di intelligenza artificiale”, sviluppando i suoi modelli di lama per competere contro gli XAI di Openai, Microsoft, Google ed Elon Musk.
“In questo momento c'è un'enorme quantità di incertezza”, ha affermato Chris Mammen, partner dello studio legale Womble Bond Dickinson, sottolineando che i casi di copyright possono richiedere anni per raggiungere una conclusione.
“È estremamente importante risolvere queste cose. Le cose continueranno ad accadere nel mondo al ritmo per collo che la tecnologia e la nostra economia si stanno sviluppando”, ha aggiunto.
Un'altra contesa nella causa prevede il metodo che i querelanti sostengono che la meta usava per acquisire il database Libgen, noto come torrenting, che spesso carica il contenuto ad altri utilizzando il software durante il download dei materiali.
Nei documenti del tribunale si afferma che il metantola del lavoro ma ha tentato di limitare la sua distribuzione. Tuttavia, deve ancora fornire garanzie che ciò è stato completamente impedito e alcune prove relative ai dati in uscita sono state eliminate, secondo le informazioni del processo di scoperta.
“Meta ha sviluppato modelli AI open source trasformazionali che stanno alimentando incredibili innovazione, produttività e creatività per individui e aziende. L'uso equo di materiali protetti da copyright è vitale per questo”, ha affermato Meta in una nota. “Non siamo d'accordo [the] Le affermazioni dei querelanti e il record completo raccontano una storia diversa. Continueremo a difenderci vigorosamente e a proteggere lo sviluppo di Genai a beneficio di tutti. “
