Le bon ordre

Ingo Scholtes de la chaire de conception de systèmes a développé une méthode d'analyse qui tient compte de l'ordre temporel des connexions au sein des réseaux. Cela permet non seulement de déterminer avec plus de précision quels thèmes sont liés entre eux sur Internet, mais aussi de mieux prédire la propagation des épidémies, par exemple.

Réseau
Comment trouver les informations pertinentes dans un réseau complexe ? Les méthodes habituelles fournissent souvent des résultats trop peu précis. (Image : ETH Zurich)

Pourquoi changer quelque chose si cela semble bien fonctionner ? Depuis de nombreuses décennies, les réseaux sont analysés selon un schéma plus ou moins identique. Par exemple, un article sur le web est considéré comme d'autant plus pertinent que de nombreux chemins sur le réseau mènent à lui. En conséquence, un article auquel renvoient de nombreux autres articles importants est classé en tête de liste par les moteurs de recherche. Le facteur déterminant est donc la structure complexe des liens, c'est-à-dire quels articles sont reliés à quels autres articles.

L'ordre chronologique est très important

"Les méthodes actuelles d'analyse des réseaux ne tiennent pas compte d'une dimension très importante, à savoir la séquence temporelle des liens", explique Ingo Scholtes, ma?tre-assistant à la chaire de conception de systèmes. Cela signifie que les algorithmes qui analysent les liens entre les articles sur le web ne tiennent pas compte de l'ordre chronologique dans lequel les utilisateurs consultent les articles. C'est pourtant ce qui serait important. En effet, l'ordre dans lequel nous nous dépla?ons à travers les réseaux d'information contient des informations précieuses sur les articles qui sont particulièrement liés entre eux sur le plan thématique et donc pertinents pour les utilisateurs.

Exemple Wikipedia : Si un utilisateur clique sur un lien vers "ETH Zurich" à partir d'un article sur "Albert Einstein", il est plus probable qu'il consulte ensuite un article en rapport avec la physique qu'un article sur les Sciences de la Terre. "Si nous prenons en compte la dimension temporelle dans l'analyse du réseau, nous pouvons faire de bien meilleures prédictions sur le comportement des utilisateurs et, sur cette base, obtenir des résultats de recherche plus pertinents et faire de meilleures recommandations", explique Scholtes.

Vue agrandie : réseau
Quels articles de Wikipédia sont particulièrement pertinents lorsqu'on recherche des personnes célèbres ? Contrairement à la méthode traditionnelle (à gauche), le nouvel algorithme (à droite) évalue les articles sur des personnes célèbres comme étant les plus pertinents. (Image : ETH Zurich)

Modèle applicable à tous les réseaux

Les découvertes d'Ingo Scholtes ne sont pas seulement importantes pour les algorithmes de recherche sur Internet. Sa méthode d'analyse peut être appliquée à toute forme de réseau. "Les réseaux sont des modèles abstraits de choses reliées entre elles", explique le spécialiste en informatique. "Cela inclut par exemple aussi les infrastructures de transport, le système financier mondial, les réseaux d'énergie, les cellules de notre corps et, outre les réseaux virtuels comme Facebook, les connexions réelles entre les personnes".

L'application de la nouvelle méthode d'analyse de réseau de Scholtes à la prédiction d'épidémies montre clairement l'importance de l'ordre chronologique : pour pouvoir prédire l'ampleur d'une vague de grippe et quels groupes de population seront touchés, il ne suffit pas de savoir quelles personnes se connaissent - c'est-à-dire sont reliées entre elles dans un réseau. L'ordre dans lequel elles se rencontrent est également décisif pour pouvoir prédire, par exemple, si Alice va transmettre sa grippe à Bob et aussi à Carol. Ce n'est que si Alice rencontre d'abord Bob, puis Bob Carol, que Carol peut être contaminée. Si Bob rencontre d'abord Carol et ensuite Alice, Carol n'attrapera pas la grippe.

En analysant le réseau du métro londonien, Scholtes a également constaté que les modèles de réseau du "tube" fréquemment utilisés sont souvent à c?té de la plaque. Par exemple, ce n'est pas parce qu'une station de métro présente de nombreuses liaisons transversales que les passagers ont la même probabilité d'utiliser tous les trajets à partir de cette station. En effet, si cette station est plut?t située en périphérie, les passagers privilégieront les liaisons qui les mènent plus loin dans le centre-ville. La ligne A est donc bien plus souvent suivie par la ligne B que par les lignes C ou D - même si, dans la perspective du réseau, elles semblent toutes aussi possibles. "Nos résultats concernant le 'London Tube' jettent une lumière critique sur l'application de méthodes basées sur les réseaux, qui sont également utilisées par exemple pour analyser les risques dans le réseau ferroviaire suisse", conclut Scholtes.

Adieu à l'ancienne méthode d'analyse

Il est important de prendre en compte à l'avenir aussi bien la structure que les relations temporelles dans l'analyse et la modélisation des réseaux, souligne Scholtes : "Il est d'une importance élémentaire pour notre société que nous utilisions les bonnes méthodes pour étudier les réseaux, car cela a des conséquences directes sur des questions aussi diverses que la résilience des infrastructures critiques ou la propagation des épidémies".

Présentation de la nouvelle méthode d'analyse de réseau

Ingo Scholtes présente ses résultats à la site externeConférence KDD2017,Ingo Scholar a participé au plus grand congrès informatique du monde sur la science des données et le big data, à Halifax, Canada. Il a en outre développé un logiciel gratuit d'analyse de réseau qui tient compte de l'ordre chronologique. Celui-ci peut être téléchargé à l'adresse suivante : site externehttps://github.com/IngoScholtes/pathpy

JavaScript a été désactivé sur votre navigateur.