12 novembre 2024

Il Text and Data Mining in ambito clinico sanitario

Normativa

Cos’è il "Text and Data Mining" e come può essere implementato in ambito clinico sanitario

Il Text and Data Mining (di seguito, “TDM”) è una tecnica di analisi computazionale automatica o semiautomatica che consiste nell’uso di strumenti informatici e algoritmi per estrarre informazioni utili, modelli o conoscenze da grandi quantità di testo o dati al fine di individuare tendenze, correlazioni e schemi nascosti.

Il TDM è particolarmente utile quando si trattano grandi quantità di dati che sarebbe impossibili analizzare manualmente e viene utilizzato nei più vari settori, tra cui quello clinico e sanitario.

L’implementazione del TDM nel settore della sanità potrebbe rivoluzionare il modo in cui verranno gestite, analizzate e utilizzate le informazioni cliniche e sanitarie. In particolare, il TDM consentirebbe di trarre valore dai dati generati quotidianamente – come cartelle cliniche elettroniche, studi clinici, pubblicazioni scientifiche e dati genetici – per migliorare l’assistenza sanitaria, la ricerca e la gestione delle risorse. Potenzialmente, l’applicazione del TDM in ambito sanitario potrebbe spaziare dalla ricerca clinica e biomedica (per la ricerca e sviluppo di nuovi farmaci), alla gestione del singolo paziente (per migliorare le diagnosi, suggerire trattamenti personalizzati e prevenire potenziali malattie), fino al monitoraggio della salute pubblica (per analisi epidemiologiche rapide e predittive), obiettivi al centro del Regolamento europeo istitutivo dello European Health Data Space - EHDS.

I possibili conflitti tra TDM, diritto d’autore e diritto “sui generis” sulle banche dati

In alcuni casi l’attività di TDM potrebbe scontrarsi con le protezioni previste dal diritto d'autore e/o dal diritto "sui generis" sulle banche dati, per esempio laddove implicasse la riproduzione di opere o l'estrazione di contenuti da una banca dati. In assenza di eccezioni o limitazioni, tali attività potrebbero essere effettuate solo su apposita autorizzazione del titolare dei diritti.

Vero è che il diritto dell'Unione europea già prevedeva talune eccezioni e limitazioni per usi a fini di ricerca scientifica; tuttavia, queste ultime non sempre parevano pienamente applicabili al TDM con conseguente incertezza giuridica per gli operatori.

La direttiva "copyright" nel mercato unico digitale: l’eccezione di TDM per scopi di ricerca scientifica

Per far fronte alle nuove opportunità di innovazione portate dal TDM e per eliminare l’incertezza giuridica di cui sopra, la direttiva (UE) 2019/790 (c.d. direttiva copyright nel mercato unico digitale, di seguito “CDSMD”) ha introdotto una nuova eccezione al diritto d’autore relativa al TDM, definito all’art. 2 come «qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni».

In particolare, l’art. 3 della CDSMD prevede che gli Stati membri debbano disporre in favore di organismi di ricerca (università, istituti di ricerca, ospedali che svolgono attività di ricerca) e istituti di tutela del patrimonio culturale (biblioteche accessibili al pubblico, musei, e archivi) un’eccezione:

per le riproduzioni e le estrazioni effettuate per le attività di TDM su opere o altri materiali cui essi hanno lecitamente accesso e per scopi di ricerca scientifica.

Sulla base di detta eccezione, in breve, gli organismi di ricerca e gli istituti di tutela del patrimonio culturale possono svolgere attività di TDM che implicano riproduzioni e/o estrazioni potenzialmente tutelate dal diritto d’autore a due condizioni: (i) che abbiano avuto legittimamente accesso alle opere e materiali oggetto di analisi e (ii) che la finalità sia di ricerca scientifica.

Il recepimento dell’eccezione di TDM per scopi di ricerca scientifica a livello nazionale

Il Legislatore italiano ha recepito l’eccezione in analisi al nuovo articolo 70-ter della L. 633/1941 (Legge sulla protezione del diritto d’autore). Sul punto si nota che la definizione di TDM europea è stata rielaborata dal Legislatore nazionale che qualifica il TDM come «qualsiasi tecnica automatizzata volta ad analizzare grandi quantità di testi, suoni, immagini, dati o metadati in formato digitale con lo scopo di generare informazioni, inclusi modelli, tendenze e correlazioni». In questo modo il Legislatore italiano, riprendendo quanto previsto ai considerando n. 8 e n. 18 della CDMSD, ha quindi enfatizzato che il TDM è un’attività che si svolge su grandi giacimenti di testi e dati e che, fra questi ultimi, possono rientrare alcune specifiche categorie quali i metadati.