Avec l'esprit de la poésie japonaise vers une science des données innovante

Le Swiss Data Science Center de l'EPF de Lausanne et de l'ETH Zurich a démarré avec succès. En septembre déjà, les scientifiques du centre ont pu lancer leur plateforme open-source Renga. Désormais, les premiers projets de recherche qui seront soutenus ont également été désignés.

SDSC
Nommée d'après la forme poétique japonaise Renga, la collaboration doit également être au centre de la nouvelle plateforme du Swiss Data Science Center. (Image : Colourbox / ETH Zurich)

Le renga est une forme de poésie japonaise que plusieurs poètes écrivent ensemble. Ils se relaient à chaque fois vers par vers. Les différentes contributions s'assemblent pour former un tout. Renga est également le nom d'une nouvelle plateforme de logiciels libres qui fonctionne sur le même principe. Des chercheurs issus des sciences naturelles, techniques et sociales élaborent de nouvelles solutions en échangeant avec des spécialistes des données. Cette plateforme a été développée par des scientifiques du Swiss Data Science Center. Ce centre commun de l'EPFL et de l'ETH Zurich constitue un pont entre les chercheurs qui produisent des données et ceux qui développent de nouvelles techniques d'analyse et de systèmes de données.

Partager les données, multiplier les connaissances

La nouvelle plateforme hébergée dans le cloud est con?ue pour les analyses les plus diverses. Les chercheurs des disciplines les plus diverses peuvent y stocker et analyser des données ordonnées, calibrées et, si nécessaire, anonymisées. Le clou de l'histoire : la plateforme grandit avec chaque projet de recherche, s'enrichit de données précieuses qui sont ensuite à nouveau à la disposition d'autres scientifiques. Comme les scientifiques des données peuvent eux aussi utiliser les données pour leurs recherches, un échange sur les solutions possibles s'engage, ce qui permet de nouvelles découvertes et d'autres projets de recherche. Ainsi, Renga favorise non seulement la collaboration multidisciplinaire, mais aussi la transparence scientifique et le développement de méthodes.

Depuis septembre, la plateforme est à la disposition des scientifiques, mais les entreprises en profitent également : lors d'une journée industrielle, on leur a montré comment elles peuvent rapidement mettre la science des données au service de leurs domaines d'activité. Elles aussi pourront à l'avenir jouer leurs données sur la plateforme et recourir à l'expertise des scientifiques des données et des informaticiens du Swiss Data Science Center pour les analyser.

Relier les compétences et leur donner des ailes

"La plateforme que nous avons construite est unique en son genre, car elle favorise de manière très pratique la performance et l'excellence de la recherche et soutient l'introduction de l'Open Data Science", explique Olivier Verschure, directeur exécutif du SDSC. Selon lui, un défi particulier a été de rendre la plateforme conviviale. Enfin, elle doit être utilisée par des chercheurs qui ne sont pas issus de l'informatique ou des sciences des données. Andreas Krause, professeur d'informatique à l'ETH Zurich et codirecteur du Centre des sciences des données, ajoute : "Nous associons les méthodes des sciences des données, comme l'apprentissage automatique ou les statistiques, aux compétences des sciences riches en données, comme les sciences de la vie ou de l'environnement".

Projets sélectionnés

Tout comme la plateforme Renga, les subventions du Swiss Data Science Center ont pour objectif de promouvoir des projets multidisciplinaires dans le domaine des sciences des données. Le soutien s'étend sur deux ans et s'élève, selon le projet, à 300'000 à 600'000 francs suisses. La première série d'appels à projets s'est achevée récemment. Soixante-quatorze chercheurs du Domaine des EPF (ETH, EPFL, PSI, WSL, Empa, Eawag) issus de dix disciplines ont posé leur candidature. Le SDSC a sélectionné huit projets, dont quatre impliquent des chercheurs de l'ETH Zurich. Les projets de l'ETH proviennent principalement des sciences de l'environnement et de la santé, mais le deep learning y est également un élément essentiel.

Le deep learning est une méthode d'apprentissage automatique. Elle consiste à utiliser un réseau neuronal artificiel pour reconna?tre des modèles typiques dans de grandes quantités de données. Les réseaux neuronaux peuvent également reconna?tre et générer des modèles et des objets dans des images, par exemple des images de visages ou d'intérieurs qui semblent à s'y méprendre.

Reconna?tre des images - dans le cosmos et sous le microscope

Thomas Hofmann, professeur d'analyse de données à l'ETH Zurich, et Alexander Refregier, de l'Institut de physique des particules et d'astrophysique, utilisent cette méthode dans leur projet SDSC pour la cosmologie. Ils veulent par exemple comparer les prédictions des modèles sur la répartition de la masse dans le cosmos et vérifier la validité d'un résultat scientifique. Dans un article récent paru dans Science Astronomy ils montrent par exemple qu'il est possible de générer, à l'aide de réseaux neuronaux, des images du cosmos qui représentent correctement ses structures et modèles complexes. Les méthodes d'apprentissage automatique élargissent ainsi les outils de la cosmologie et aident à explorer l'évolution de l'univers.

Le projet d'Ender Konukoglu, professeur de traitement d'images médicales à l'ETH Zurich, et d'Anne Bonnin, de la chaire d'imagerie radiologique de l'ETH Zurich, repose sur la même méthode. Ils n'étudient toutefois pas des images de l'univers, mais des images microscopiques dans les domaines de la médecine et de la biologie. Ils espèrent ainsi obtenir des analyses d'images plus détaillées et une meilleure compréhension des interactions biologiques.

Initiative nationale pour les sciences des données

Le Swiss Data Science Center est un projet commun de l'EPF de Lausanne et de l'ETH Zurich. Il a été créé en janvier 2017 dans le but de permettre et d'encourager simultanément la collaboration multidisciplinaire dans le domaine de la science des données.

Les sciences des données font partie des domaines de recherche stratégiques du Domaine des EPF pour les années 2017 à 2020. Depuis septembre 2017, l'EPFL et l'ETH Zurich proposent des filières d'études de master en sciences des données, ce qui conduira à de nouvelles collaborations avec le Swiss Data Science Center (SDSC).

JavaScript a été désactivé sur votre navigateur.