La médecine dans la frénésie des données

Génomique, dossiers de patients numérisés et surveillance de la santé en temps réel - jamais autant de données sur la santé n'ont été disponibles. Trois chercheurs de l'ETH racontent comment ils extraient des informations pertinentes de ce flot de données et quelles opportunités cela représente pour la médecine personnalisée.

La science des données va fortement modifier l'imagerie du futur. (Image : Scanderbeg Sauer Photography).
La science des données va considérablement modifier l'imagerie du futur. (Image : Scanderbeg Sauer Photography)

Karsten Borgwardt s'exprime sans h?te et de manière réfléchie, comme s'il voulait ainsi apporter un peu de calme dans un domaine de recherche où tout est turbulent. Les sciences des données dans la recherche biomédicale connaissent actuellement un boom : plus de professeurs, plus de subventions, plus de capacité de calcul et plus de coopération en matière de recherche. Le "Machine Learning & Computational Biology Lab" de Borgwardt au Département des systèmes biologiques à B?le est passé à 15 collaborateurs depuis sa création en juin 2014 - et d'autres viendront s'y ajouter.

Le professeur de 36 ans incarne un nouveau type de data scientist, tel qu'il devrait occuper une place de choix dans la médecine du futur. Il a étudié l'informatique avec la biologie comme matière secondaire, et dans ce dernier domaine, il a en outre obtenu un master à l'Université d'Oxford lors de sa quatrième année d'études. Borgwardt a grandi avec le décryptage du premier génome humain et était déjà fasciné par les nouvelles possibilités de la génomique pendant ses études. Mais il sait aujourd'hui que les espoirs initiaux étaient souvent exagérés : "Nous sommes encore loin de pouvoir déduire avec précision la présence de maladies complexes à partir du génome d'une personne". Une explication possible : ce ne sont pas des modifications isolées du génome, mais plut?t l'interaction de millions de paires de bases dans l'ADN humain qui sont responsables de maladies complexes comme le cancer ou le diabète. Et c'est là que l'informatique entre en jeu.

Explosion des données en génomique

Pour pouvoir reproduire et simuler de telles interactions, il faut une quantité énorme de données. Aujourd'hui - 16 ans après la publication de la séquence du génome humain - celles-ci sont disponibles. "Nous assistons actuellement à une explosion des quantités de données dans plusieurs dimensions", raconte Borgwardt. Gr?ce aux progrès techniques en génomique, des milliards de paires de bases d'un génome humain peuvent aujourd'hui être séquencées en quelques jours - et ce pour moins de 2000 francs. Cela ouvre de toutes nouvelles possibilités : Alors qu'auparavant, les questions au niveau moléculaire de l'individu étaient au premier plan, les chercheurs s'intéressent aujourd'hui de plus en plus aux questions au niveau de la population ; donc finalement au patrimoine génétique de l'ensemble de l'humanité. Parallèlement, la surveillance de l'état de santé se déplace de mesures ponctuelles, par exemple lors de la visite annuelle chez le médecin, vers des mesures continues en temps réel. Les "wearables" et les applications pour smartphones permettent déjà d'enregistrer à tout moment le pouls, la température corporelle et les mouvements. Aux nouvelles possibilités en matière de surveillance de la santé et de génomique s'ajoute le fait que les dossiers des patients sont de plus en plus disponibles sous forme électronique dans les h?pitaux.

Borgwardt
"Nous assistons actuellement à une explosion des volumes de données dans plusieurs dimensions"Prof. Karsten Borgwardt

Toutes ces données recèlent un grand potentiel. Si l'on parvient à les utiliser de manière ciblée, les thérapies pourraient être personnalisées et leur efficacité augmentée, espèrent les chercheurs. "Dans ce contexte, le hasard devient une grandeur extrêmement importante", explique Borgwardt. En effet, un algorithme doit pouvoir faire la différence entre les relations aléatoires entre les données des patients et l'apparition d'une maladie et les relations statistiquement significatives. "Avec l'aide d'un subside de démarrage du FNS, son groupe de recherche développe donc de nouveaux algorithmes qui détectent des modèles statistiquement significatifs dans d'énormes montagnes de données. Ces algorithmes sont plus rapides, nécessitent moins de capacité de calcul et peuvent séparer les données pertinentes des données non pertinentes de manière beaucoup plus efficace qu'auparavant.

Pour les soins intensifs

Gr?ce aux progrès de la génomique et à la digitalisation croissante des données des patients, la science des données devient pertinente pour la médecine. L'"European Bioinformatics Institute" prévoit que d'ici cinq ans, le génome de 15% de la population des pays industrialisés, soit 150 millions de personnes, aura été séquencé. Gunnar R?tsch, professeur d'informatique biomédicale, fait le calcul : Cela représenterait environ 28 exaoctets (= 28×109 gigaoctets) de données. Afin d'extraire de telles quantités de données pour la recherche et les patients des connaissances qui contribuent à des thérapies plus précises et personnalisées, de nouveaux algorithmes efficaces sont nécessaires. Ceux-ci doivent par exemple rechercher des interactions pertinentes pour la maladie dans des milliards de paires de bases. Dans le cadre d'un projet du Programme national de recherche 75 "Big Data", le groupe de R?tsch s'efforce de stocker et d'analyser efficacement les grandes quantités de données génomiques. "Nous sommes au milieu d'une percée !", déclare le scientifique des données, euphorique.

Mais comment les patients peuvent-ils concrètement profiter de ces algorithmes intelligents ? R?tsch présente un exemple pratique : En étroite collaboration avec l'H?pital de l'?le de Berne, son groupe développe, avec celui de Borgwardt, un système d'alerte précoce pour les défaillances d'organes dans les unités de soins intensifs. Pendant dix ans, l'h?pital a enregistré les données de près de 54 000 patients concernant la pression artérielle, le pouls, la température, la prise de médicaments, le niveau de glucose et de lactose ainsi que l'électrocardiogramme (ECG). R?tsch développe maintenant des algorithmes pour analyser ces 500 gigaoctets de données, avec environ 3,5 milliards de mesures individuelles, afin d'identifier des modèles indiquant une urgence imminente. Les médecins et le personnel soignant pourraient ainsi à l'avenir prendre des mesures avant que l'état de santé d'un patient ne se détériore visiblement. De tels systèmes nécessitent l'apprentissage automatique, un domaine important de la science des données. Les programmes doivent reconna?tre des modèles et des lois à partir d'un ensemble de données donné et apprendre ainsi en permanence.

R?tsch
"L'arrivée de la science des données à l'h?pital va également donner naissance à une nouvelle génération de médecins".Prof. Gunnar R?tsch

Radiologie automatisée

L'apprentissage automatique joue un r?le important non seulement dans l'analyse des données des patients, mais aussi dans le perfectionnement des appareils médicaux. C'est le cas par exemple de l'imagerie par résonance magnétique (IRM), qui fait aujourd'hui partie des principales méthodes d'examen médical, notamment pour les tissus mous. Klaas Prüssmann, professeur à l'Institut de technique biomédicale, géré conjointement par l'ETH et l'Université de Zurich, s'est consacré au développement de l'IRM. Dans un article publié récemment, il décrit un système qui utilise 30 capteurs de température et 16 capteurs magnétiques pour établir un autodiagnostic de l'appareil IRM. En cas de modèles suspects, les techniciens pourraient à l'avenir être avertis à temps, ce qui permettrait de réduire les temps d'immobilisation de l'appareil à l'h?pital et de réaliser des économies.

Dans son domaine de recherche, Prüssmann ressent lui aussi actuellement "la veille d'une période de ruée vers l'or". Il part du principe qu'à l'avenir, la science des données ne modifiera pas seulement les appareils IRM, mais aussi l'imagerie en elle-même. "Si nous parvenons, lors d'enregistrements IRM, à transformer des connaissances préalables pertinentes, par exemple le fait que nous examinons un cerveau et non un c?ur, en une forme utilisable pour notre système, nous pourrions fortement augmenter la vitesse, l'efficacité et la pertinence des mesures". ? l'avenir, il sera en effet possible de comparer des millions d'images IRM existantes avec une mesure actuelle. Cela permettra d'obtenir des indications importantes sur certaines maladies. De plus, des algorithmes pourront identifier des motifs dans les images IRM qui ne sont pas visibles à l'?il nu.

Prüssmann
"Nous pourrions fortement augmenter la vitesse, l'efficacité et la pertinence des mesures".Prof. Klaas Prüssmann

Appel à l'harmonisation

Les experts s'accordent à dire que l'un des plus grands défis pour les applications de la science des données dans le domaine de la santé est le manque d'harmonisation des données. "Les données anonymisées provenant de différents h?pitaux à des fins de recherche ne sont souvent pas directement comparables", raconte Borgwardt. Et son collègue R?tsch d'ajouter : "Dans les h?pitaux, les données ont jusqu'à présent souvent été collectées pour les décomptes des caisses maladie et non pour une analyse plus approfondie." Il place de grands espoirs dans le "Swiss Personalized Health Network" (SPHN), auquel participent des hautes écoles et des cliniques suisses, afin d'assurer l'interopérabilité des données et de faciliter le transfert de données entre les h?pitaux et les institutions de recherche.

R?tsch voit d'autres défis : "Dans le quotidien clinique, ce sont les patients et la sécurité des données qui sont en première ligne, et non l'enregistrement de toutes les données pertinentes pour des recherches approfondies sur les big data". Les scientifiques des données devraient montrer encore plus clairement où ils peuvent aider les médecins sans perturber le quotidien clinique ou mettre en danger la sécurité des données. C'est pourquoi il considère le Bachelor en médecine humaine, qui sera dispensé pour la première fois à l'ETH à l'automne 2017 et qui comprend également des cours d'informatique et d'apprentissage automatique, comme une étape importante dans le rapprochement des sciences des données et de la médecine. "L'arrivée de la science des données à l'h?pital va également donner naissance à une nouvelle génération de médecins", affirme R?tsch avec conviction.

Cet article est publié dans le dernier numéro de "Globe" paru.

JavaScript a été désactivé sur votre navigateur.