La medicina nella frenesia dei dati

Genomica, cartelle cliniche digitalizzate e monitoraggio della salute in tempo reale: mai prima d'ora sono stati disponibili così tanti dati sulla salute. Tre ricercatori dell'ETH spiegano come estraggono le informazioni rilevanti da questa marea di dati e quali opportunità offre la medicina personalizzata.

La scienza dei dati cambierà la diagnostica per immagini del futuro. (Immagine: Scanderbeg Sauer Photography).
La scienza dei dati cambierà l'imaging del futuro. (Immagine: Scanderbeg Sauer Photography)

Karsten Borgwardt parla in modo calmo e deliberato, come se volesse portare un po' di calma in un campo di ricerca caratterizzato dalla turbolenza. La scienza dei dati nella ricerca biomedica sta vivendo un boom: più professori, più finanziamenti, più capacità di calcolo e più cooperazioni nel settore della ricerca. Il "Machine Learning & Computational Biology Lab" di Borgwardt presso il Dipartimento biosistemi e ingegneria di Basilea è cresciuto fino a 15 collaboratori dalla sua fondazione nel giugno 2014 - e altri ne arriveranno.

Il professore 36enne incarna un nuovo tipo di scienziato dei dati che probabilmente avrà un posto fisso nella medicina del futuro. Ha studiato informatica con una specializzazione in biologia, completando poi un master in quest'ultima presso l'Università di Oxford al quarto anno di studi. Borgwardt è cresciuto con la decodifica del primo genoma umano e già durante gli studi era affascinato dalle nuove possibilità della genomica. Ma oggi sa che le speranze iniziali erano spesso esagerate: "Una possibile spiegazione è che non sono i singoli cambiamenti nel genoma, ma piuttosto l'interazione di milioni di coppie di basi nel DNA umano a essere responsabili di malattie complesse come il cancro o il diabete. Ed è qui che entra in gioco l'informatica.

Esplosione di dati nella genomica

Per mappare e simulare tali interazioni sono necessarie enormi quantità di dati. Oggi - 16 anni dopo la pubblicazione della sequenza del genoma umano - questi dati sono disponibili. "Attualmente stiamo vivendo un'esplosione di volumi di dati in diverse dimensioni", afferma Borgwardt. Grazie ai progressi tecnici della genomica, oggi è possibile sequenziare miliardi di coppie di basi di un genoma umano in pochi giorni e per meno di 2.000 franchi. Questo apre possibilità completamente nuove: Mentre un tempo le questioni a livello molecolare del singolo individuo erano al centro dell'attenzione, ora i ricercatori sono sempre più interessati a questioni a livello di popolazione, cioè, in ultima analisi, al patrimonio genetico dell'umanità nel suo complesso. Allo stesso tempo, il monitoraggio dello stato di salute si sta spostando da misurazioni selettive, ad esempio in occasione delle visite mediche annuali, a misurazioni continue in tempo reale. I dispositivi indossabili e le app per smartphone possono già essere utilizzati per registrare le pulsazioni, la temperatura corporea e i modelli di movimento in qualsiasi momento. Oltre alle nuove possibilità di monitoraggio della salute e della genomica, i dossier dei pazienti sono sempre più disponibili elettronicamente negli ospedali.

Borgwardt
"Stiamo vivendo un'esplosione di volumi di dati in diverse dimensioni".Prof Karsten Borgwardt

Tutti questi dati hanno un grande potenziale. I ricercatori sperano che, se si potessero utilizzare in modo mirato, le terapie potrebbero essere personalizzate e il loro effetto aumentato. "Il caso diventa un fattore estremamente importante", spiega Borgwardt. Questo perché un algoritmo deve essere in grado di distinguere tra le correlazioni casuali tra i dati dei pazienti e l'insorgenza di una malattia e quelle statisticamente significative. "Con l'aiuto di una sovvenzione di avviamento del FNS, il suo gruppo di ricerca sta quindi sviluppando nuovi algoritmi che individuano modelli statisticamente significativi in enormi montagne di dati. Gli algoritmi sono più veloci, richiedono meno capacità di calcolo e possono separare i dati rilevanti da quelli irrilevanti in modo molto più efficiente rispetto al passato.

Per l'unità di terapia intensiva

I progressi della genomica e la crescente digitalizzazione dei dati dei pazienti rendono la scienza dei dati rilevante per la medicina. L'Istituto europeo di bioinformatica prevede che entro cinque anni sarà sequenziato il genoma del 15% della popolazione dei Paesi industrializzati, ovvero 150 milioni di persone. Gunnar R?tsch, professore di informatica biomedica, fa i conti: Si tratterebbe di circa 28 exabyte (= 28×109 gigabyte) di dati. Sono necessari nuovi ed efficienti algoritmi per estrarre conoscenze da tali volumi di dati per la ricerca e i pazienti, che contribuiranno a terapie più precise e personalizzate. Questi dovrebbero, ad esempio, cercare interazioni rilevanti per la malattia in miliardi di coppie di basi. Nell'ambito di un progetto del Programma nazionale di ricerca 75 "Big Data", il gruppo di R?tsch sta lavorando all'archiviazione e all'analisi efficiente di grandi quantità di dati genomici. "Siamo nel bel mezzo di una svolta!", afferma euforico il data scientist.

Ma come possono i pazienti beneficiare effettivamente di questi algoritmi intelligenti? R?tsch presenta un esempio pratico: In stretta collaborazione con l'Inselspital di Berna, il suo gruppo sta lavorando con il gruppo di Borgwardt per sviluppare un sistema di allarme precoce per l'insufficienza d'organo nel reparto di terapia intensiva. Per dieci anni, l'ospedale ha registrato i dati relativi a pressione sanguigna, polso, temperatura, assunzione di farmaci, livelli di glucosio e lattosio ed elettrocardiogrammi (ECG) di quasi 54.000 pazienti. R?tsch sta ora sviluppando algoritmi per analizzare questi 500 gigabyte di dati con circa 3,5 miliardi di misurazioni individuali alla ricerca di modelli che indichino un'emergenza imminente. In futuro, ciò potrebbe consentire a medici e assistenti di avviare misure prima che lo stato di salute di un paziente si deteriori visibilmente. Tali sistemi richiedono l'apprendimento automatico, un'importante branca della scienza dei dati. I programmi devono riconoscere schemi e regolarità da un dato insieme di dati e quindi imparare continuamente.

R?tsch
"L'arrivo della scienza dei dati negli ospedali creerà anche una nuova generazione di medici".Prof Gunnar R?tsch

Radiologia automatizzata

L'apprendimento automatico svolge un ruolo importante non solo nell'analisi dei dati dei pazienti, ma anche nell'ulteriore sviluppo di apparecchiature mediche. Ad esempio, nella risonanza magnetica (MRI), che oggi è uno dei metodi di esame medico più importanti, soprattutto per i tessuti molli. Klaas Prüssmann, professore dell'Istituto di ingegneria biomedica, gestito congiuntamente dall'ETH e dall'Università di Zurigo, si è dedicato all'ulteriore sviluppo della risonanza magnetica. In un articolo pubblicato di recente, descrive un sistema che utilizza 30 sensori di temperatura e 16 sensori magnetici per creare un'autodiagnosi del dispositivo MRI. In futuro, i tecnici potrebbero essere avvisati tempestivamente di modelli sospetti, riducendo così i tempi di inattività del dispositivo in ospedale e risparmiando sui costi.

Anche Prüssmann percepisce attualmente "la vigilia di una corsa all'oro" nel suo campo di ricerca. Ritiene che in futuro la scienza dei dati non cambierà solo i dispositivi di risonanza magnetica, ma anche l'imaging stesso. "Se riusciamo a convertire le conoscenze pregresse delle registrazioni MRI, ad esempio che stiamo esaminando un cervello e non un cuore, in una forma utilizzabile dal nostro sistema, potremmo aumentare notevolmente la velocità, l'efficienza e il valore informativo delle misurazioni". In futuro sarà possibile confrontare milioni di immagini di risonanza magnetica esistenti con una misurazione attuale. Ciò fornirà informazioni importanti su alcune malattie. Gli algoritmi saranno anche in grado di riconoscere modelli nelle immagini di risonanza magnetica non visibili a occhio nudo.

Prüssmann
"Potremmo aumentare notevolmente la velocità, l'efficienza e l'importanza delle misurazioni".Prof Klaas Prüssmann

Appello all'armonizzazione

Gli esperti concordano sul fatto che una delle maggiori sfide per le applicazioni della scienza dei dati nel settore sanitario è la mancanza di armonizzazione dei dati. "I dati anonimizzati provenienti da diversi ospedali per scopi di ricerca spesso non sono direttamente comparabili", afferma Borgwardt. E il suo collega R?tsch aggiunge: "Negli ospedali, i dati sono stati spesso raccolti per la fatturazione dell'assicurazione sanitaria e non per ulteriori analisi"."Egli nutre grandi speranze per la "Rete sanitaria personalizzata svizzera" (SPHN), alla quale partecipano scuole universitarie e cliniche svizzere per garantire l'interoperabilità dei dati e facilitare il trasferimento dei dati tra ospedali e istituti di ricerca.

R?tsch vede ulteriori sfide: "Nella pratica clinica quotidiana, i pazienti e la sicurezza dei dati sono la priorità assoluta e non la registrazione di tutti i dati rilevanti per ulteriori ricerche sui big data". Gli scienziati dei dati devono mostrare ancora più chiaramente dove possono aiutare i medici senza interrompere la pratica clinica quotidiana o mettere a rischio la sicurezza dei dati. Per questo ritiene che il Bachelor Human Medicine, che sarà offerto per la prima volta all'ETH nell'autunno 2017 e che include anche corsi di informatica e apprendimento automatico, sia un passo importante per avvicinare la scienza dei dati alla medicina. "L'arrivo della scienza dei dati negli ospedali creerà anche una nuova generazione di medici", è convinto R?tsch.

Questo articolo è pubblicato nell'attuale numero di "Globo" è stato pubblicato.

JavaScript è stato disabilitato sul tuo browser