Modello di città realizzato esclusivamente con immagini

Gli scienziati dell'ETH hanno combinato milioni di immagini e video per creare un modello tridimensionale e vivente di una città, nello specifico di Zurigo. La nuova tecnologia ha numerose applicazioni e può, ad esempio, analizzare dove camminano i pedoni e quando ci sono parcheggi disponibili.

Vista ingrandita: modello della città di Zurigo
Il modello tridimensionale di Zurigo si basa esclusivamente su dati di immagini. (Immagine: ETH di Zurigo)

I ricercatori dell'ETH di Zurigo hanno sviluppato una piattaforma tecnologica che permette di creare modelli 3D di città basati esclusivamente su informazioni di immagine. La piattaforma, chiamata Varcity, è così versatile da poter utilizzare, analizzare e combinare automaticamente tutte le fonti di immagini possibili: fotografie aeree, immagini panoramiche a 360 gradi scattate con veicoli speciali, ma anche foto ordinarie, come quelle postate dai turisti sui social network e sulle piattaforme internet. La tecnologia utilizza anche materiale video, come filmati di YouTube e dati provenienti da webcam pubbliche.

Grazie agli algoritmi di apprendimento automatico, la tecnologia è in grado di riconoscere contenuti di immagini come edifici, finestre e porte, strade, specchi d'acqua, persone e automobili. Senza l'intervento umano, il modello 3D creato "sa", ad esempio, quali sono i marciapiedi e - analizzando i dati delle webcam - quali strade sono percorribili solo in una direzione.

Vista ingrandita: modello della città di Zurigo Vegetazione
Utilizzando algoritmi di apprendimento automatico, il modello è in grado di distinguere tra edifici, strade, vegetazione e specchi d'acqua. (Immagine: ETH di Zurigo)
Vista ingrandita: modello di facciate e finestre di Zurigo
Il modello riconosce anche le facciate e le finestre (in giallo e rosso negli edifici in primo piano a sinistra). (Immagine: ETH di Zurigo)

"Riempire di vita i modelli di città"

"Il tutto arriva al punto di poter analizzare il flusso del traffico sulla strada in modo molto dettagliato e misurare i flussi pedonali, anche in tempo reale a seconda dell'applicazione", spiega Hayko Riemenschneider. ? postdoc e responsabile del progetto Varcity nel gruppo di Luc Van Gool, professore del Computer Vision Lab dell'ETH di Zurigo. Questo rende i conteggi del traffico molto semplici: possono essere effettuati solo con telecamere e non richiedono più sensori installati nella carreggiata.

"La nostra tecnologia porta la dinamica, la vita, le persone e i veicoli nei modelli 3D delle città. Questo è uno dei principali vantaggi della nostra tecnologia rispetto ad applicazioni ben note come Google Street View", afferma Riemenschneider. La tecnologia si basa anche sul principio della "privacy by design": Gli algoritmi generano informazioni dai dati delle immagini in forma anonima. Nelle visualizzazioni, i flussi di persone e di traffico sono visualizzati come avatar. Varcity è quindi conforme alla protezione dei dati.

Grandi quantità di dati analizzati

Gli scienziati hanno sviluppato gli algoritmi informatici corrispondenti negli ultimi cinque anni nell'ambito di un progetto finanziato dal Consiglio europeo della ricerca (ERC Advanced Grant per l'ETH, professor Van Gool). Come oggetto illustrativo, hanno creato un modello 3D della città di Zurigo, che ora presentano in un video in occasione della prevista conclusione del progetto.

La tecnologia di Varcity si basa sull'analisi di un'enorme quantità di dati di immagini. "Più immagini e video la piattaforma è in grado di analizzare, più il modello diventa preciso", spiega Kenneth Vanhoey, postdoc del gruppo di Van Gool. "L'obiettivo del nostro progetto era sviluppare gli algoritmi per questi modelli di città in 3D. Ciò si basa sul presupposto che la quantità di immagini e video disponibili continuerà ad aumentare rapidamente nei prossimi anni".

Gli scienziati utilizzano la triangolazione per creare un modello tridimensionale dai dati delle immagini. Per farlo, hanno bisogno di diverse immagini di un oggetto da diverse angolazioni. Chi siamo, analizzando le distanze e gli angoli nelle diverse immagini, può localizzare con precisione i punti d'angolo dell'oggetto nello spazio.

Tecnologia di guida al parcheggio semplice

Gli scienziati non propongono il modello di città in sé come applicazione, ma ci sono numerosi usi possibili per la tecnologia. Tra questi, la pianificazione urbana e dei trasporti. Per commercializzare le applicazioni basate sulla tecnologia, i partecipanti al progetto hanno anche fondato diverse start-up: Spectando offre ispezioni virtuali degli edifici per il mercato immobiliare e Casalva effettua analisi virtuali dei danni agli edifici per le compagnie di assicurazione, ad esempio dopo tempeste come la grandine. Per queste applicazioni non sono necessari dispositivi speciali: sono sufficienti le immagini di un normale smartphone.

Anche l'ETH Parquery, spin-off nato da Varcity, utilizza questa tecnologia. L'azienda ha sviluppato un sistema di guida al parcheggio che funziona esclusivamente con telecamere puntate sui parcheggi e non necessita di sensori di parcheggio. Il computer analizza i dati video in tempo reale, è in grado di riconoscere le auto e quindi sa quali posti auto sono vuoti, ma anche quali auto non sono state parcheggiate secondo le regole. Il sistema è stato il primo a essere utilizzato a Locarno. Esistono altri 30 progetti a livello internazionale.

Infine, l'ETH Uniqfeed utilizza i metodi per riconoscere la pubblicità perimetrale e i singoli giocatori durante le trasmissioni televisive di eventi sportivi. Ciò consente di calcolare la durata della loro visibilità durante la trasmissione e di personalizzare la pubblicità perimetrale per diversi gruppi di utenti.

Riproducendo il video, si accetta l'informativa sulla privacy di YouTube.Per saperne di più OK
Video: L'ETH di Zurigo
JavaScript è stato disabilitato sul tuo browser