I dati sanitari stanno diventando il motore della ricerca clinica
Il Caffè Digitale


Le informazioni sanitarie digitali (di real world) sono sempre più riconosciute come una risorsa utilissima per fare ricerca scientifica, ma solo quando vengono integrate, standardizzate e inserite in architetture organizzative coerenti. La sfida non riguarda la disponibilità tecnologica, ma la capacità di costruire flussi coordinati e ben governati.
L’attività di ricerca scientifica in ambito clinico si sta spostando verso sistemi che registrano ogni giorno l’attività sanitaria. Una quota crescente di conoscenza giace tra cartelle cliniche elettroniche, registri e piattaforme ospedaliere, che generano flussi informativi continui, ma spesso eterogenei e non allineati tra loro. Queste informazioni stanno venendo progressivamente riorganizzate e trattate come una base strutturata su cui sviluppare nuove forme di ricerca, capaci di seguire i fenomeni clinici nella loro evoluzione reale. Si tratta dei cosiddetti dati secondari, ossia del riuso a fini di ricerca delle informazioni raccolte attraverso la pratica clinica.
Questo patrimonio informativo deriva da un processo articolato che richiede costruzione, pulizia, standardizzazione e integrazione, e solo attraversando questi passaggi diventa davvero utilizzabile in modo confrontabile. E scalabile. La difficoltà si concentra qui: trasformare flussi disomogenei in strutture leggibili, mantenendo continuità nel tempo e coerenza tra contesti diversi. Quando questo lavoro riesce, i dati diventano strumenti operativi per studiare fenomeni clinici su larga scala.
Su questi temi che si è concentrata la sessione di sguardo prospettico della Healthcare Innovation Executive Conference 2026, organizzata da TIG insieme ad AISIS (Associazione Italiana Sistemi Informativi in Sanità) e tenutasi a Roma lo scorso 23 aprile, dedicata al ruolo del digitale nella ricerca clinica. Uno degli elementi più evidenti riguarda il passaggio da una logica centrata sulla raccolta dei dati a una logica di ingegneria del dato. Matteo Gabetta, responsabile della sicerca e sviluppo di Biomeris, caso italiano d’eccellenza a livello europeo, ha tracciato il lavoro necessario per trasformare dati eterogenei in sistemi interrogabili: lo standard internazionale per organizzare e analizzare dati sanitari OMOP (Observational Medical Outcomes Partnership) rappresenta una delle architetture più avanzate, perché consente di integrare informazioni provenienti da fonti diverse e di renderle confrontabili secondo standard condivisi. Questo non elimina la complessità, ma la sposta a monte, nel processo di mappatura e normalizzazione.
Il paradigma federato applicato alla ricerca clinica
Nel modello federato ogni ospedale o centro di ricerca conserva i propri dati nei sistemi in cui vengono prodotti, senza spostarli o centralizzarli. Quando si vuole condurre uno studio, non si raccolgono le informazioni in un unico database: si utilizza invece lo stesso algoritmo, che viene eseguito separatamente all’interno di ciascun sistema. Ogni nodo elabora i propri dati e restituisce risultati già aggregati, che possono essere messi insieme per ottenere un quadro complessivo. In questo modo le organizzazioni mantengono il controllo delle informazioni e si riducono i passaggi più critici legati alla gestione della privacy, mentre diventa possibile lavorare su basi ampie e distribuite senza dover costruire archivi centralizzati. Applicazioni di questo tipo sono già presenti in ambito europeo, soprattutto nei registri di patologia e nelle reti dedicate alle malattie rare, dove la distribuzione dei dati rende necessario un approccio di questo tipo.
Infatti, le tecnologie necessarie sono già disponibili e continuano a evolvere rapidamente, anche se la loro presenza non basta di per sé a rendere i dati realmente utilizzabili. Alfredo Cesario, CEO di Gemelli Digital Medicine & Health, ha descritto un percorso in cui l’integrazione tra attività clinica e infrastrutture digitali si costruisce nel tempo, attraverso passaggi progressivi che coinvolgono organizzazione, processi e competenze. Il dato entra in tutte le fasi del lavoro, dalla raccolta alla gestione fino all’analisi, ma produce valore solo quando questi livelli riescono a funzionare insieme. La difficoltà si concentra proprio qui: mettere in relazione sistemi diversi, allineare le competenze e definire modalità operative condivise che permettano al dato di circolare senza perdere coerenza.
Questa trasformazione ha ricadute dirette anche sul lavoro clinico. Diana Ferro, attiva tra SIIAM (Società Italiana Intelligenza Artificiale in Medicina) e Ospedale Bambino Gesù di Roma, ha portato l’esperienza di utilizzo di sistemi avanzati di intelligenza artificiale a supporto della ricerca, a partire dal co-scientist di Google di cui è una delle prime utilizzatrici in Italia. L’introduzione di questi strumenti non comporta una sostituzione delle competenze, ma una loro ridefinizione: cambia il modo in cui si formulano le domande, si analizzano i dati e si interpretano i risultati. La rapidità con cui queste tecnologie evolvono, anche a livello internazionale, rende necessario un aggiornamento continuo delle pratiche e dei modelli formativi, e le potenzialità già effettive di questi strumenti sono impressionanti.
Il quadro normativo e l’economia seguono l’evoluzione tecnologica
Un altro elemento riguarda il modo in cui i dati entrano nei processi di sviluppo e valutazione. Giuseppe Seghi Recli, componente della Giunta di Farmindustria, ha evidenziato il ruolo crescente dei dati secondari in affiancamento agli studi clinici tradizionali, contribuendo a costruire modelli basati sugli outcome del mondo reale e a rafforzare l’approccio della value-based medicine. Tuttavia, la possibilità di utilizzare questi dati dipende da condizioni ancora non pienamente soddisfatte, come l’accesso, l’interoperabilità e l’allineamento dei diversi sistemi informativi. Su questo piano si inserisce anche il tema normativo. Erica Molinari, Data Protection Officer dell’Azienda USL di Modena, ha sottolineato l’importanza di integrare gli aspetti regolatori fin dalle prime fasi di progettazione. L’approccio by design rappresenta una condizione necessaria per rendere sostenibili i processi nel tempo, ma incontra difficoltà operative legate alla struttura delle organizzazioni e alla mancanza diffusa di unità dedicate alla gestione del dato. Il quadro normativo, dal Regolamento generale sulla protezione dei dati (GDPR) alle iniziative europee come lo European Health Data Space, continua a cambiare per adattarsi a modelli che non erano stati previsti in origine. Insomma, le tecnologie sono disponibili e in rapido sviluppo, mentre la loro integrazione richiede un lavoro più lento e stratificato.

Gianluca Dotti
Giornalista, TIG – The Innovation Group
![]()
