NEWSLETTER - IL CAFFE' DIGITALE
L’impatto della data analysis nell’industria farmaceutica – II parte

N. Dicembre 2020
  

a cura di
Ezio Viola
, Co-Founder
e Carmen Camarca, Analyst
The Innovation Group

Questo mese abbiamo fatto colazione con…
Duccio Medini, Head of Data Science and Digital Innovation, GSK Vaccines R&D

A seguito dell’ “AI & Data Forum Live 2020” di The Innovation Group, che si è tenuto lo scorso 17 novembre, abbiamo intervistato Duccio Medini, Head of Data Science and Digital Innovation, GSK Vaccines R&D, che ci ha parlato di come la trasformazione digitale stia impattando sull’industria farmaceutica e di cosa comporti realizzare attività e progetti di data sharing in un settore in cui i dati trattati sono di estrema sensibilità. Riportiamo di seguito la seconda parte dell’intervista che si soffermerà in modo particolare sull’utilizzo dell’Intelligenza Artificiale e Analytics nell’ambito della vaccinologia e quali implicazioni ciò comporta in un periodo caratterizzato da una forte attenzione ai vaccini e alle cure sperimentali per combattere il Covid-19.

 

L’impatto della data analysis nell’industria farmaceutica – II parte

Un vaccino può essere definito come la perturbazione di due sistemi complessi interagenti: l’agente patogeno che causa la malattia (virus, batterio o parassita) e l’ospite, cioè l’uomo. Il processo di realizzazione di un vaccino richiede la collaborazione e l’interazione di competenze eterogenee e coinvolge funzioni differenti (dalla Ricerca e Sviluppo al manufacturing al marketing). Tali funzioni possono comunicare tra loro soltanto attraverso il linguaggio comune dei dati che, per riuscire ad ottenere con successo il prodotto finale, devono essere integrati. Come si interviene? Quali sono nel dettaglio gli ambiti di applicazione delle tecnologie di Analytics, Machine Learning e Artificial Intelligence nella value chain dell’industria dei vaccini?

A discutere del tema è stato Duccio Medini, Head of Data Science and Digital Innovation, GSK Vaccines R&D, intervenuto lo scorso 17 novembre all’AI&Data Forum Live 2020. Riportiamo di seguito la seconda parte della sua intervista condotta in vista dell’evento e integrata con i principali spunti emersi dal suo intervento.

Focalizzando l’analisi sul settore R&D, si parte dall’identificazione di un medical need – afferma Medini – e si inizia a investigare facendo discovery di base, ricerca scientifica. Questa fase si completa andando a investigare in animali l’effettiva efficacia e sicurezza dei prodotti che la fase di discovery ha proposto. A questo punto si passa nell’uomo, con prove cliniche (chiamate “trials”) di prodotto di dimensione minima, la cosiddetta “Fase I”, in cui si parte coinvolgendo un numero ridotto di individui (da 10 a massimo 100) per testare la sicurezza del nuovo vaccino in investigazione. Si passa poi a trial che coinvolgono centinaia di individui per determinare il miglior dosaggio e la miglior strategia di somministrazione, o Fase II, per concludere con trial di grandissime dimensioni (o Fase III, fino a decine di migliaia di individui) per confermare la sicurezza e determinare l’efficacia del vaccino. Questo processo viene accompagnato dallo sviluppo tecnologico della produzione del materiale del farmaco, quindi si parte dalla produzione delle prime dosi su bassa scala fino alle produzioni più massive per i trial clinici di Fase III, per poi arrivare alle costruzioni di impianti di manufacturing specifici per quel prodotto che permettono di distribuire miliardi di dosi alla popolazione.

Se tutte queste prove cliniche hanno successo, il vaccino viene immesso nel mercato e a quel punto la salute pubblica si occupa del prodotto, lo distribuisce e lo utilizza e continua una fase di ricerca volta ad utilizzare i dati che emergono dall’uso del prodotto nella popolazione.

All’interno di questo processo, soluzioni di data science e intelligence intervengono sostanzialmente ovunque. Nell’identificazione del medical need, come ad esempio in healthmap.org, facendo mining di social media e analisi quantitativa avanzata di dati su larga scala si identifica immeditatamente dove si crea un cluster iniziale di una malattia infettiva. Grazie all’intelligenza artificiale, inoltre, è possibile identificare l’antigene giusto, un processo di selezione che ormai avviene con la strategia di reverse vaccinology, oggi utilizzata nella sua versione 2.0 e basata, appunto, su deep learning.

Con riferimento all’altra componente del vaccino, l’adiuvante, vengono utilizzate sempre di più tecnologie che generano grandi moli di dati con i campioni biologici: da una goccia di sangue si isolano milioni di cellule e per ogni cellula si genera un genoma completo.

Nell’ambito del clinical trial, una delle evoluzioni a cui si sta lavorando è in relazione alla scrittura di documenti. Ogni prova clinica ha un suo protocollo che deve essere approvato dall’autorità regolatoria e che descrive tutto ciò che accade, un’attività che si sta facendo svolgere a dei computer con input umano.

Infine, un’ulteriore area in cui la data science sta incidendo in maniera significativa con approcci di modelling dinamico è quella definita dell’health economics. Nel dettaglio consiste nell’individuare se, grazie al vaccino, una certa frazione della popolazione non si ammala e il livello di risparmio del sistema sanitario nazionale (un risparmio generato, appunto, dal valore del prodotto).

Si rileva, inoltre, un forte impatto di data science ed Intelligenza Artificiale nell’ottimizzazione e qualità del manufacturing, processo in cui si richiede un controllo dettagliato: in quest’ambito si sta usando sempre di più predictive analytics per comprendere eventuali criticità e capire dove intervenire in anticipo, anche sviluppando delle “copie digitali” del processo di manufacturing chiamate “digital twins”.

Bisogna, infine, chiarire un aspetto. Intelligenza Artificiale e data science stanno trasformando notevolmente tutte le aree di R&S, tuttavia quando si analizza l’impatto e il livello di maturità digitale dell’industria farmaceutica rispetto al mercato, questo verticale è molto indietro, avendo l’indice di digitalizzazione più basso dopo la pubblica amministrazione.

 

Quali sono le principali criticità del processo appena descritto? In quali aree si deve o si dovrà intervenire?

Fino a 15 anni fa l’area su cui era necessario intervenire era quella relativa alla ricerca scientifica, ovvero alla composizione dell’antigene e dell’adiuvante. Adesso, anche se con alcune eccezioni (ad esempio HIV), per la maggior parte delle malattie infettive la reverse vaccinology e la biologia strutturale hanno risolto questo problema, per cui data science e genomics permettono di intervenire nei processi in modi e tempi brevi. L’incredibile novità di questi giorni di AlphaGo (DeepMind) che ha risolto dopo 50 anni il problema del folding delle proteine, è un’altra indicazione di straordinario impatto dell’intelligenza artificiale sulla fase iniziale di ricerca. Maggiori difficoltà si stanno, invece, riscontrando in relazione all’accelerazione dei trial clinici. Nel dettaglio, si sta cercando di investire in ambiti quali l’automatizzazione e la flessibilizzazione dei processi in modo da ridurre i tempi che questi prevedono.

Inoltre, soprattutto nel periodo delicato che si sta vivendo, si rilevano importanti ambiti di applicazione dell’analytics nella produzione a rischio (che prevede la realizzazione di grandi stock del prodotto prima di sapere se sarà possibile distribuirli) che potrebbe permettere di comprendere quale può essere un modello di rischio adeguato alle necessità e ai tempi di produzione.

In un momento di crisi eccezionale come quella portata dal COVID, stiamo assistendo ad una grande accelerazione delle fasi cliniche dovuta alla priorità planetaria e alla disponibilità di enormi investimenti pubblici e privati a rischio: si spendono enormi somme di danaro per preparare in anticipo le fasi successive prima di aver completato le fasi precedenti.

Ma in un contesto normale è difficile immaginare la stessa propensione all’investimento a rischio, e senz’altro la mancanza di un ecosistema che integri dati di salute e prove cliniche rende molto difficile oggi fare data decisioning.

 

Allo stato attuale in quali aree si sta lavorando maggiormente?

Ci sono progetti relativi soprattutto all’utilizzo di Intelligenza Artificiale per svolgere analisi non supervisionata di immagini microscopiche che permettano di identificare in modo più veloce e accurato anticorpi monoclonali, la cui efficacia è immediata e che possono essere iniettati direttamente nel paziente. Si tratta di un’attività di estrema rilevanza soprattutto in un periodo come quello che si sta vivendo che permetteranno, in attesa dell’arrivo del vaccino, di avere in Italia un’arma potente di terapia e prevenzione contro il Covid.

 

Quali implicazioni per il futuro?

Quattro messaggi chiave.

  1. Negli ultimi 150 anni, i vaccini sono l’intervento che si è rilevato di maggior impatto per la salute umana dopo l’acqua potabile.
  2. Scoprire nuovi vaccini e riuscire a portarli alla popolazione che ne ha bisogno richiede ingenti moli di dati.
  3. La data science applicata alla vaccinologia ha già dimostrato di avere un grande potere trasformativo ma la mancanza di un’integrazione completa dei dati che poi vanno analizzati e sinergizzati per supportare questo processo rappresenta ancora un grande ostacolo.
  4. Per tali ragioni, la trasformazione digitale del verticale dell’industria farmaceutica è un percorso appassionante, appena iniziato, destinato a creare nei prossimi anni significativi cambiamenti soprattutto nell’ambito della salute pubblica.

Qui la prima parte.

Categorie
FOCUS CYBER
IL CAFFÈ DIGITALE - ARCHIVIO
@TIG_italia