Pêcher des perles dans la mer des données

Les données sont des trésors : De nouveaux mondes s'ouvrent aux organisations qui savent puiser des informations utiles dans le flot de données non structurées. Lors du rendez-vous local du président de l'ETH, des chercheurs et des représentants de l'économie ont montré comment les données pourraient à l'avenir servir à un large public.

Vue agrandie : ralph eichler
Ralph Eichler, président de l'ETH, a accueilli de nombreux invités à la réunion locale sur le thème du big data. (Image : Tom Kawara)

Que font 130 représentants de l'industrie, de la recherche et de la politique dans un hall en béton nu au cinquième sous-sol du nouveau b?timent LEE de la Leonhardstrasse à Zurich ? Ils cherchent à se rapprocher des données ; de quantités incroyables de données. Car ici, une fois la construction achevée en juin, de nombreuses tours d'ordinateurs stockeront et traiteront d'énormes quantités de données de recherche. Le président de l'ETH Ralph Eichler et l'ETH Zurich Foundation ont organisé mercredi dernier une rencontre de deux heures sur le thème des "big data", c'est-à-dire des chances et des risques liés à l'utilisation active de ces masses de données en expansion.

Révolution technologique

Dirk Helbing, professeur de sociologie à l'ETH, a illustré le flot pur et simple de données générées aujourd'hui dans le monde par quelques chiffres impressionnants : En une année, on produit aujourd'hui plus de données que dans toute l'histoire de l'humanité jusqu'à présent. La puissance des processeurs des ordinateurs double tous les 18 mois et dans dix à quinze ans, des ordinateurs aussi puissants que le cerveau humain seront disponibles. "Nous sommes en train de vivre une révolution technologique", a constaté Helbing. "Et cela va aussi bouleverser le marché du travail".

Pour Helbing, cet océan de données, composé d'e-mails, de tweets, de vidéos Youtube, de rapports d'activité, de données de capteurs et d'images, recèle d'incroyables possibilités : Des simulations avec des données provenant des marchés financiers, de l'économie réelle, d'épidémies, de conflits et de changements environnementaux pourraient fournir des informations en temps réel sur la manière dont les décisions politiques, économiques et écologiques affectent notre monde futur. "Le big data nous aidera à prendre des décisions beaucoup mieux informées", affirme Helbing avec conviction.

Big Data en médecine

"Big Data" est déjà aujourd'hui pratiquement incontournable dans le monde scientifique. Rien que sur les six projets de recherche qui, jusqu'en janvier 2013, se sont disputés des projets phares de l'UE et donc un milliard d'euros de subventions, trois promettaient de nouvelles connaissances gr?ce à l'analyse d'énormes quantités de données. Qu'il s'agisse des neurosciences, de la recherche sur le cancer ou de la sociologie, la plupart des disciplines deviendront à l'avenir, du moins en partie, des sciences des "big data".

Comme l'a expliqué Joachim M. Buhmann, professeur d'informatique à l'ETH, dans son exposé introductif, la médecine est actuellement très intéressée par les données massives. Les médecins collectent d'innombrables données pour établir des diagnostics et des pronostics. La plupart du temps, celles-ci sont archivées après une évaluation partielle, sans être utilisées. Cela doit changer : Buhmann développe des systèmes permettant de relier les données des patients et les données de diagnostic, de pronostic et de thérapie des médecins. Des algorithmes pourraient alors calculer, par exemple dans des images de prélèvements de tissus, où se trouve l'information essentielle dans l'image et la comparer simultanément avec des milliers de jeux de données similaires. Ou bien les algorithmes se mettent à la recherche de ce que l'on appelle des biomarqueurs qui donnent des indications sur certaines maladies, comme le cancer par exemple. Tout cela dans le but de condenser les informations jusqu'à ce qu'il soit possible de faire des déclarations aussi probables que possible sur l'évolution d'une maladie et les chances de succès des thérapies. Buhmann s'est également prononcé en faveur de la mise en place d'une "Health Data Science", une science composée d'experts qui savent traiter de telles données.

Obstacles techniques et protection des données

Martin Erkens, vice-directeur et Global Head of Pharma Research & Early Development Informatics chez F. Hoffmann-La Roche, a toutefois mis en garde contre des attentes trop élevées : "La réalité est actuellement encore en retard sur les promesses". Son expérience dans le secteur pharmaceutique lui a appris que de très nombreux problèmes techniques doivent encore être résolus pour pouvoir utiliser de manière judicieuse les données des patients dans des applications "Big Data".

En plus des problèmes techniques, des questions de protection des données se posent également : actuellement, l'analyse des données peut encore être effectuée par l'entreprise elle-même, selon Erkens. Mais cela pourrait changer à l'avenir si la quantité de données produites est telle que l'entreprise doit faire appel à une aide externe pour les analyser.

Donald Kossmann, professeur d'informatique à l'ETH, a esquissé dans son exposé introductif des solutions possibles pour minimiser les risques liés au traitement des données personnelles. Il a présenté une technologie permettant de relier différents ensembles de données dans un "nuage" et de les rendre accessibles à des tiers, tout en conservant les données brutes.

Transmission de données par nécessité

En médecine notamment, la protection de la personnalité est une priorité absolue. Mais si l'on veut profiter de pronostics sophistiqués, il faut contribuer au pool de données avec ses propres données de patients. Brigitte Tag, professeure à la chaire de droit pénal, de droit de la procédure pénale et de droit médical de l'université de Zurich, a souligné que la transmission de données médicales n'est souvent pas volontaire, mais résulte d'une situation d'urgence. Pour un rétablissement rapide, tous les moyens sont souvent bons pour le patient. Pour elle, la règle est donc la suivante : "Faire confiance, c'est bien, mais contr?ler, c'est mieux". L'utilisation des données des patients doit d'une part être clairement réglementée par la loi, et d'autre part, les utilisateurs doivent avoir confiance dans le fait que les données sont effectivement utilisées pour le bien de la collectivité. Il est dans la nature des choses que la législation ait aujourd'hui toujours un temps de retard sur l'évolution rapide de la technologie. Là où le droit n'est pas encore efficace, c'est l'éthique qui entre en jeu, a expliqué Tag.

Un exemple récent en Angleterre a montré qu'elle n'est pas non plus toujours efficace : des médecins de famille y ont alimenté une banque de données nationale avec des informations sur les patients, sans en informer ces derniers. Le projet "care.data" a été stoppé parce que l'opinion publique s'est indignée. "Il faut définir clairement qui possède quelles données et ce qui peut en être fait", a exigé Tag. "Et nous devons toujours nous poser la question : Que veulent les personnes dont nous recevons les données".

Dirk Helbing, professeur de sociologie, a esquissé une possibilité de garantir la souveraineté de ses propres données : via un compte de données numériques personnel, l'utilisateur pourrait à l'avenir disposer librement de ses données et les supprimer si nécessaire. Selon Helbing, les données personnelles pourraient alors être vendues à une sorte de boutique d'applications, où elles seraient évaluées en fonction de leur qualité et mises à la décision des entrepreneurs pour leurs idées commerciales.

Trois nouvelles chaires "big data

Ralph Eichler, président de l'ETH, a réaffirmé vers la fin de la réunion locale son intention de continuer à développer la "science des données" à l'ETH. Trois nouvelles chaires devraient être créées à cet effet dans un avenir proche : Une pour "Medical IT" en collaboration avec l'H?pital universitaire de Zurich, une pour "Systèmes d'information" et une pour "Social Network Analysis". Les connaissances ainsi générées en matière de "Big Data" devraient notamment profiter à la place économique suisse. Eichler a en outre annoncé que l'ETH soumettrait au Parlement un message pour la période 2017-2020 visant à uniformiser la structure des données de tous les h?pitaux universitaires suisses.

JavaScript a été désactivé sur votre navigateur.