Direttiva Copyright e Text and Data Mining

Negli ultimi giorni si è a lungo parlato delle novità introdotte dalla direttiva europea sul diritto d’autore nel mercato unico digitale (“Direttiva Copyright”), approvata dal Parlamento Europeo lo scorso 26 marzo.

Sebbene oggetto dei maggiori dibattiti siano stati agli (ex) articoli 11 e 13, a causa delle possibili ripercussioni sulla libertà di diffusione delle informazioni online, la sempre maggiore importanza attribuita ai big data e all’intelligenza artificiale (di cui abbiamo già avuto modo di discutere qui con Marco Galli), ci ha spinto ad approfondire nell’articolo di oggi le novità introdotte da un’altra (non meno rilevate) disposizione della Direttiva Copyright. Ci riferiamo agli articoli 3 e 4 che, nell’ultima versione della Direttiva, hanno introdotto due eccezioni al diritto d’autore, entrambe obbligatorie per gli Stati membri, volte a favorire l’attività di estrazione di testi e dati, il cosiddetto text e data mining.

Ma andiamo con ordine…che cos’è il text e data mining (per semplicità, anche TDM)?

Il TDM è un processo di estrazione e analisi automatizzata di grandi quantità di dati in formato digitale tramite l’applicazione di algoritmi, con l’obiettivo di generare informazioni (ivi inclusi, modelli, tendenze e correlazioni) e renderle disponibili e direttamente utilizzabili per finalità diverse. L’analisi dei big data è, infatti, ampiamente utilizzata non solo nella ricerca scientifica e medica, ma anche nel marketing, nella finanza e, più in generale, in ambito commerciale, oltre che per esigenze di sicurezza e intelligence nazionale.

Semplificando, nel processo di TDM è possibile distinguere tre fasi:

  • accesso a grandi quantità di contenuti – quali articoli di riviste scientifiche, libri, immagini, registrazioni musicali o film;
  • estrazione e/o copia di tali contenuti; e
  • elaborazione dei testi, estrazione di dati strutturati e analisi degli output.

Trattandosi di contenuti (nella maggioranza dei casi) protetti dalla normativa sul diritto d’autore, il TDM solleva rilevanti questioni circa la sua compatibilità con le leggi sulla proprietà intellettuale. Si ricorda, infatti, che il creatore di un’opera creativa ha il diritto esclusivo di pubblicare e utilizzare economicamente la propria opera e che, pertanto, è necessaria la sua autorizzazione per poter procedere alla copia e alla elaborazione di tale lavoro creativo (lo stesso dicasi per il costitutore di una banca dati non creativa, a cui è riconosciuto il diritto sui generis di vietare operazioni di estrazione o reimpiego della stessa).

A dimostrazione della necessità di trovare un corretto bilanciamento tra gli interessi del creatore di un’opera intellettuale, da un lato, e quelli del mercato, dall’altro, si evidenzia che diversi paesi si sono già attivati per introdurre nelle proprie normative nazionali specifiche eccezioni al diritto d’autore.

Sul punto, si segnala in primo luogo il Giappone, che con un emendamento del Japan Copyright Act in vigore dal 2011, è stato il primo paese a introdurre una limitazione volta proprio a consentire “the information analysis by using a computer” – definita come l’attività di estrazione di “information, concerned with languages, sounds, images or other elements constituting such information, from many works” – e le connesse attività di “recording on a memory” e di “adaptation of a work, to the extent deemed necessary” (art. 47 septies). L’ampiezza di tale eccezione, comprensiva anche delle attività di analisi di dati per finalità commerciali, dimostra ancora una volta l’attenzione prestata da questo paese al progresso tecnologico e, più in generale, alla ricerca e all’innovazione.

A seguire, nel 2014, l’Inghilterra è stato il primo paese dell’unione europea ad introdurre nel Copyright, Designs and Patents Act 1988 una specifica eccezione che consente il text e data analysis, ma (a differenza della normativa nipponica) solo per finalità di ricerca non-commerciale. In particolare, tale norma prevede la facoltà, estesa a tutti coloro che hanno lecito accesso ad un’opera altrui (e, quindi, non solo agli istituti di ricerca), di effettuare copie “for carry out a computational analysis of anything recorded in the work for the sole purpose of research for a non-commercial purpose” (art. 29A).

Più recentemente, anche altri paesi europei, quali l’Estonia, la Germania, l’Islanda e la Francia, hanno introdotto, ovvero hanno proposto di introdurre, nella propria normativa sul copyright specifiche eccezioni in materia di TDM.

E’ in tale frastagliato contesto che trovano spazio le nuove norme adottate dalla Direttiva Copyright. L’assenza di disposizioni chiare a livello europeo sull’uso del TDM unitamente all’indiscutibile rilevanza ormai acquisita a livello mondiale dai big data e dall’intelligenza artificiale, sembrano infatti essere state colte dalle istituzioni europee come un impulso per adattare il sistema di eccezioni del diritto d’autore, ormai tecnologicamente obsoleto, alle nuove forme di sfruttamento di opere e contenuti.

Così, l’articolo 3 e 4, nella loro ultima versione approvata dal Parlamento Europeo, prevedono un’ampia ed obbligatoria eccezione al diritto d’autore per il TDM a beneficio non più solo degli istituti di ricerca ma, più in generale, anche degli enti privati.

Nello specifico, l’articolo 3 prevede l’obbligo per gli Stati membri di introdurre un’eccezione al diritto esclusivo di riproduzione, nonché al diritto di vietare l’estrazione da una banca dati, a favore delle università e degli altri organismi di ricerca, così come degli istituti di tutela del patrimonio culturale. Ciò a condizione che l’attività di riproduzione ed estrazione (i) avvenga per scopi di ricerca scientifica e (ii) abbia ad oggetto opere o altri materiali a cui tali enti abbiano avuto legalmente accesso. Peraltro, tale eccezione è riconosciuta agli organismi di ricerca anche nel caso in cui le loro attività siano svolte nel quadro di partenariati pubblico-privato (Considerando 11), salvo i casi in cui i risultati delle attività di TDM vadano a beneficio di un’impresa che eserciti un’influenza dominante sugli organismi di ricerca.

E’, peraltro, con il successivo articolo 4 che le istituzioni europee appaiono pienamente riconoscere la rilevanza di tale nuovo fenomeno tecnologico, prevedendo l’obbligo per gli Stati membri di disporre “un’eccezione o una limitazione … per le riproduzioni e le estrazioni effettuate da opere o altri materiali cui si abbia legalmente accesso ai fini dell’estrazione di testo e di dati”. Si tratta, pertanto, di un’eccezione supplementare per il TDM, che contempla tale utilizzo al di là dell’ambito della ricerca. Anche in tale caso, tuttavia, il legislatore europeo limita la concessione a quei contenuti di cui si abbia accesso legale e sui quali i relativi titolari non abbiano riservato i diritti di effettuare riproduzioni ed estrazioni (ad esempio, in caso di contenuti resi pubblicamente disponibili online, attraverso strumenti che consentano una lettura automatizzata, inclusi i metadati e i termini e le condizioni di un sito web o di un servizio). Infine, le copie realizzate potranno essere conservate unicamente per il tempo necessario ai fini dell’estrazione di testo e di dati.

In definitiva, ferma restando la necessità di verificare come tali indicazioni verranno recepite nella normativa nazionale, appare evidente la volontà degli istituti europei di creare un contesto di maggiore certezza giuridica al fine di incentivare l’innovazione mediante l’utilizzo di sitemi di AI e machine learning e di incoraggiare la collaborazione transfrontaliera e la collaborazione interdisciplinare, ormai sempre più rilevanti per poter competere con il mercato extra-europeo.

Vittoria Omarchi