ANGELA MARIA GALLO, Text and Data Mining (TDM) e violazioni del copyright: l’addestramento della GenAI e il diritto umano alla scienza alla luce di alcuni elementi di prassi recente

Abstract (ITA)

Le eccezioni di Text and Data Mining (TDM) previste dagli articoli 3 e 4 della direttiva 2019/790 sul diritto d’autore e sui diritti connessi nel mercato unico digitale consentono di effettuare attività di riproduzione ed estrazione di opere coperte da copyright sia per finalità di ricerca che per scopi commerciali. Tuttavia, poiché anche l’addestramento dell’intelligenza artificiale si fonda, come il TDM, su un’analisi automatizzata dei dati volta a generare informazioni – tra cui modelli, tendenze e correlazioni – alcuni fornitori di modelli di IA hanno iniziato a invocare le predette eccezioni per giustificare l’utilizzo, senza licenza o autorizzazione, di opere protette da copyright ai fini dell’addestramento. In questo contributo si analizza una fattispecie decisa recentemente dal Tribunale di Amburgo, in cui i giudici tedeschi erano chiamati a stabilire se le attività di estrazione e analisi dei dati svolte a fini di ricerca potessero integrare una violazione del diritto d’autore qualora tra i dati utilizzati per l’addestramento dell’IA fosse compresa un’opera protetta. L’analisi prosegue con l’approfondimento di ulteriori elementi di prassi, tenendo conto delle linee di tendenza emergenti negli ordinamenti statali e nelle norme internazionali e dell’Unione europea. L’obiettivo è verificare se le eccezioni di text and data mining – in quanto strumenti funzionali alla ricerca scientifica e, al contempo, tecnologia alla base dell’addestramento dell’IA, oggi impiegata come mezzo di informazione – possano trovare fondamento nel diritto alla scienza, inteso quale diritto alla diffusione della conoscenza. A tal fine, si riflette anche sulla possibilità che tale diritto possa costituire un limite ai diritti di proprietà intellettuale riconosciuti e tutelati a livello internazionale.

Abstract (ENG)

The exceptions for text and data mining (TDM) provided for in Articles 3 and 4 of Directive 2019/790 on copyright and related rights in the digital single market allow for the reproduction and extraction of copyright-protected works for both research and commercial purposes. However, since artificial intelligence training, like TDM, is based on automated data analysis aimed at generating information – including patterns, trends and correlations – some AI model providers have begun to invoke the above exceptions to justify the use, without licence or authorisation, of copyright-protected works for training purposes. This article analyses a case recently decided by the Hamburg Regional Court, in which German judges were called upon to determine whether data mining and analysis activities carried out for research purposes could constitute copyright infringement if the data used for AI training included a protected work. The analysis continues with an in-depth examination of other significant elements of practice, taking into account emerging trends in national legal systems and in international and European Union regulations. The aim is to verify whether text and data mining exceptions – as tools for scientific research and, at the same time, the technology underlying the training of AI now used as a means of information – can be based on the right to science, understood as the right to the dissemination of knowledge. To this end, consideration is also given to the possibility that this right may serve as a limitation on intellectual property rights recognised and protected at international level.

DOWNLOAD IN FORMATO PDF

.