L'ordine giusto

Ingo Scholtes della cattedra di Design dei sistemi ha sviluppato un metodo di analisi che tiene conto della sequenza temporale delle connessioni all'interno delle reti. Questo non solo permette di determinare con maggiore precisione quali argomenti sono correlati tra loro su Internet, ma consente anche di prevedere con maggiore precisione la diffusione di epidemie, ad esempio.

Rete
Come trovare le informazioni rilevanti in una rete complessa? I metodi abituali spesso forniscono risultati non abbastanza precisi. (Immagine: ETH di Zurigo)

Perché cambiare qualcosa quando ovviamente funziona bene? Per molti decenni, le reti sono state analizzate seguendo più o meno lo stesso schema. Ad esempio, un articolo sul web viene classificato come tanto più rilevante quanto maggiore è il numero di percorsi nella rete che portano ad esso. Di conseguenza, un articolo a cui fanno riferimento molti altri articoli importanti viene elencato ai primi posti dai motori di ricerca. La struttura complessa dei link, cioè quali articoli sono collegati a quali altri articoli, è quindi decisiva per questo.

La sequenza temporale è molto importante

"Gli attuali metodi di analisi delle reti ignorano una dimensione molto importante, ovvero la sequenza temporale dei collegamenti", afferma Ingo Scholtes, assistente in capo alla cattedra di Systems Design. Ciò significa che gli algoritmi che analizzano i collegamenti tra gli articoli sul web non tengono conto della sequenza temporale in cui gli utenti accedono agli articoli. Tuttavia, questo sarebbe importante. Dopo tutto, l'ordine in cui ci muoviamo attraverso le reti informative contiene informazioni preziose su quali articoli sono particolarmente legati dal punto di vista tematico e sono quindi rilevanti per gli utenti.

Prendiamo ad esempio Wikipedia: Se un utente clicca su un link da un articolo su "Albert Einstein" a "ETH di Zurigo", è più probabile che acceda successivamente a un articolo relativo alla fisica piuttosto che a uno sulle Scienze Terrestri. "Se teniamo conto della dimensione temporale nell'analisi delle reti, possiamo fare previsioni molto migliori sul comportamento degli utenti e, sulla base di questo, ottenere risultati di ricerca più pertinenti e formulare raccomandazioni migliori", afferma Scholtes.

Vista ingrandita: rete
Quali articoli di Wikipedia sono particolarmente rilevanti quando si cercano personaggi famosi? A differenza del metodo convenzionale (a sinistra), il nuovo algoritmo (a destra) valuta gli articoli sui personaggi famosi come i più rilevanti. (Immagine: ETH di Zurigo)

Modello applicabile a tutte le reti

Le scoperte di Ingo Scholtes non sono importanti solo per gli algoritmi di ricerca su Internet. Il suo metodo di analisi può essere applicato a qualsiasi forma di rete. "Le reti sono modelli astratti di cose connesse tra loro", spiega lo specialista informatico. "Queste includono, ad esempio, le infrastrutture di trasporto, il sistema finanziario globale, le reti energetiche, le cellule del nostro corpo e, oltre alle reti virtuali come Facebook, le connessioni reali tra le persone".

L'applicazione del nuovo metodo di analisi di rete di Scholtes nella previsione delle epidemie illustra l'importanza dell'ordine temporale: per prevedere quanto si diffonderà un'epidemia di influenza e quali gruppi di popolazione saranno colpiti, non è sufficiente sapere quali persone si conoscono - cioè sono collegate tra loro in una rete. Anche l'ordine in cui si incontrano è fondamentale per prevedere, ad esempio, se Alice trasmetterà la sua malattia influenzale a Bob e anche a Carol. Solo se Alice incontra prima Bob e poi Bob incontra Carol, Carol può essere infettata. Se Bob incontra prima Carol e poi Alice, Carol non si ammalerà di influenza.

Analizzando la rete della metropolitana di Londra, Scholtes ha anche scoperto che i modelli di rete spesso utilizzati per la metropolitana sono spesso sbagliati. Il fatto che una stazione della metropolitana abbia molte connessioni incrociate, ad esempio, non significa che i passeggeri abbiano la stessa probabilità di utilizzare tutti i percorsi da qui. Se la stazione si trova nella periferia della città, i passeggeri preferiranno i collegamenti che li portano più in centro. ? quindi molto più probabile che la linea A sia seguita dalla linea B piuttosto che dalle linee C o D, anche se tutte sembrano ugualmente possibili dal punto di vista della rete. "I nostri risultati relativi alla 'London Tube' gettano una luce critica sull'applicazione dei metodi basati sulla rete, utilizzati anche, ad esempio, per analizzare i rischi della rete ferroviaria svizzera", afferma Scholtes.

Addio al precedente metodo di analisi

? importante considerare sia la struttura che le relazioni temporali quando si analizzano e modellano le reti in futuro, sottolinea Scholtes: "? di fondamentale importanza per la nostra società utilizzare i metodi giusti per studiare le reti, poiché ciò ha un impatto diretto su questioni diverse come la resilienza delle infrastrutture critiche o la diffusione delle epidemie".

Presentazione del nuovo metodo di analisi di rete

Ingo Scholtes presenta i suoi risultati al convegno pagina esternaConferenza KDD2017,Ingo Scholtes è stato relatore alla D-INFK, la più grande conferenza mondiale di informatica sulla scienza dei dati e sui big data, tenutasi ad Halifax, in Canada. Ha inoltre sviluppato un software gratuito per l'analisi delle reti che tiene conto della sequenza temporale. ? disponibile per il download all'indirizzo pagina esternahttps://github.com/IngoScholtes/pathpy

JavaScript è stato disabilitato sul vostro browser