Anthropic vince la prima causa sul fair use
Prima storica decisione sul tema fair use e sistemi di intelligenza artificiale, che ha segnato un punto a favore di Anthropic.
Attesa da tempo, il 23 Giugno 2025 è stata emessa la prima storica decisione sul fair use, che ha segnato un punto a favore di Anthropic, seguita dopo due giorni da una seconda decisione che ha decretato la vittoria di Meta sullo stesso tema.
Si tratta, in entrambi i casi, di una decisione interinale a cui dovrà fare seguito una sentenza definitiva, ma questo non riduce l’importanza delle affermazioni sostenute che hanno ad oggetto la liceità o meno dell’uso di dati coperti da diritti per l’addestramento delle macchine.
Fair Use
Ricordiamo che il fair use è una dottrina statunitense elaborata dalla giurisprudenza e introdotta nell’art. 17 dell’U.S. Code, paragrafo 107, che prevede che sia lecito utilizzare materiale protetto da copyright, senza chiedere il consenso ai titoli dei diritti, quando ricorrono alcuni presupposti.
In particolare occorre, caso per caso, effettuare una valutazione complessiva di quattro elementi:
l’eventuale uso trasformativo della copia,
la natura dell’opera copiata,
la quantità di materiale copiato,
l’impatto sul mercato di detta copia.
Tendenzialmente quando viene riscontrato un uso trasformativo, che si ha ogni volta che lo scopo che si pone chi copia è completamente diverso rispetto a quello per cui è stata creata, viene riconosciuto il fair use.
Ad esempio, copiare un testo per realizzare un sistema che agevoli la ricerca di parole al suo interno può essere considerato lecito, a condizione che chi esegue questa operazione non renda disponibile sul mercato il testo integrale.
Il caso The Author Guild v. Google
Questo è quanto è stato deciso nel 2015 nel caso The Author Guild v. Google del 2015, relativo al servizio Google Books, per realizzare il quale Google aveva copiato interi libri protetti da copyright per sviluppare un sistema che agevolasse la ricerca al suo interno di determinate parole. Google Books consentiva agli utenti di visualizzare solo piccole parti di testo per contestualizzare l’esito della ricerca, ma mai il libro completo.
Considerando tutti i quattro fattori di fair use, la Corte ha ritenuto che la copia digitale completa delle opere da parte di Google per fornire al pubblico le sue funzioni di ricerca e una visualizzazione per estratti rientrasse nel fair use e non violasse il copyright degli autori, perché non rendeva inutile l’acquisto del libro, dato che non lo metteva a disposizione dei lettori, e soprattutto perché la copia era strumentale alla fornitura di un servizio completamente diverso rispetto alla mera lettura del testo.
Il caso Bartz et al. v. Anthropic
Questa decisione è alla base della difesa di Anthropic nella prima causa su cui ci concentreremo (C 24-05417), promossa nell’Agosto 2024 da un gruppo di autori che contestavano l’uso delle loro opere in fase di addestramento, ma nulla riguardo agli output generati dal sistema.
Anthropic, sentendosi forte delle sue ragioni, ha chiesto al giudice di emettere una decisione preliminare soltanto sul fair use, al fine di stabilire fin da subito se l’uso dei dati protetti potesse essere considerato lecito sulla base della dottrina americana.
Anthropic non ha solo richiamato il caso The Author Guild v. Google ma ha addirittura assunto Tom Turvey, ex responsabile delle collaborazioni per il progetto di scansione dei libri di Google Books, con il compito di ottenere licenze per «tutti i libri del mondo», cosa che non ha fatto, optando per l’acquisto di copie cartacee destinate a costituire la «biblioteca di ricerca» del sistema AI che rischia di essere la buccia di banana su cui potrebbe scivolare.
Stando a quanto risulta dagli atti, la società avrebbe scelto di scansionare milioni di libri, per poi estrarre da essi i dati e le informazioni necessarie per l’addestramento, avvalendosi sostanzialmente di una tecnica analoga a quella utilizzata da Google Books, realizzando la sua raccolta e confidando in una soluzione giuridica analoga a suo favore.
La Corte ha stabilito con fermezza che utilizzare opere protette per addestrare sistemi di intelligenza artificiale rientra nel principio del fair use e deve essere considerato lecito.
Lo scopo e la natura dell’utilizzo di opere protette da copyright per addestrare modelli linguistici di grandi dimensioni (LLM) al fine di generare nuovo testo sono stati ritenuti “trasformativi”.
«Come qualsiasi lettore che aspira a diventare scrittore, gli LLM di Anthropic si sono addestrati su tali opere non per replicarle o sostituirle, ma per imboccare una strada diversa e creare qualcosa di nuovo» afferma la Corte e se questo processo implica la creazione di copie, queste copie sono a loro volta impiegate in un modo trasformativo e lecito.
Ogni opera selezionata per l’addestramento è stata elaborata almeno quattro volte, prima copiandola in formato digitale nella libreria centrale, poi ripulendola, rimuovendo testo eventualmente inutile, poi trasformandola in sequenze numeriche, o token e infine conservando le copie compresse in un apposito repository.
Nessuna divulgazione esterna è stata fatta, per cui gli utenti non avrebbero potuto mai accedere ai testi integrali, proprio come accadeva nel caso Google Books. Gli autori non lamentano quindi alcuna violazione di copyright riguardo agli output e tutte le contestazioni restano circoscritte agli input.
In merito ai libri che Anthropic ha acquistato in formato cartaceo, la Corte dà completamente torto agli autori, ritenendo che la semplice conversione di un libro in formato digitale sia lecita e non rappresenti un’opera derivata, in quanto in sé non ha alcuna originalità e che come un umano impara dai libri, altrettanto può fare un LLM che si addestra su quei testi.
Le copie pirata
Il punto cruciale riguarda però i testi che sono stati presi da Internet o da banche dati senza acquistare le copie cartacee o richiedere i relativi diritti. In merito a questi la decisione della Corte è stata altrettanto ferma e decisa in senso contrario ad Anthropic che ha provato a difendersi sostenendo che l’acquisizione di copie pirata fosse necessaria per facilitare l’addestramento o per la difficoltà di trovare i testi originali.
La Corte ha però ribadito che non esiste alcuna sentenza che sostenga che “piratare” un libro sia ragionevolmente necessario per scrivere una recensione, condurre ricerche o addestrare un LLM. Questo comportamento sarebbe illecito, anche se le copie pirata fossero state immediatamente usate per un uso trasformativo e subito eliminate, ma nel caso di specie la situazione è aggravata dal fatto che Anthropic non si è limitata a usare quelle copie esclusivamente per addestrare i suoi LLM, ma le ha conservate inserendole nella sua biblioteca centrale.
Piratare opere per costruire una biblioteca di ricerca senza pagarle e conservarle qualora potessero rivelarsi utili non è stato considerato un uso trasformativo.
La stessa copia può essere usata in modi diversi, con risultati giuridici differenti e in questa causa ha giocato un brutto scherzo ad Anthropic l’avere dichiarato che le copie erano state ottenute per «costruire una biblioteca di ricerca» contenente fatti ben organizzati, analisi e esempi espressivi per diversi usi, uno dei quali era l’addestramento.
Il fatto che il fine principale fosse la creazione di questa biblioteca ha indotto il giudice a non ritenere applicabile il principio del fair use per le opere acquisite illecitamente, giungendo ad affermare che il pagamento successivo non può annullare i danni derivanti dalla pirateria iniziale.
Chi acquista un libro non deve più rendere conto del possesso della copia, ma chi copia il libro da un sito pirata ha già violato il diritto d’autore.
Per approfondire
Ho affrontato le tematiche di copyright, fair use e intelligenza artificiale nel mio libro “A chi spettano i diritti sulle opere dell’intelligenza artificiale”, edito da Maggioli Editore.
Attraverso un’analisi pratica di casi, sia pendenti che già decisi, il libro entra nel vivo delle contrapposte ragioni delle parti, al fine di fornire spunti e strumenti utili a colleghi, ma anche alle aziende per orientare le loro scelte di business.
Molto interessante Laura!