Un passo avanti ai ladri

Un nuovo metodo di apprendimento automatico sviluppato dagli scienziati dell'ETH permette di prevedere i furti con scasso anche in aree scarsamente popolate.

Furti con scasso
Diverse variabili come l'ora del giorno, l'ubicazione e la densità di popolazione aiutano a valutare se un determinato appezzamento di terreno è a rischio di furto con scasso o meno in un determinato momento. (Immagine: ETH di Zurigo)

I furti con scasso non avvengono ovunque e in qualsiasi momento. Esistono comuni, quartieri e strade, nonché periodi dell'anno e del giorno a rischio minore o maggiore. L'apprendimento automatico può essere utilizzato per riconoscere modelli dalle statistiche sui furti e prevedere il rischio di furto in un determinato luogo. I programmi informatici possono quindi aiutare la polizia a identificare i cosiddetti hotspot - luoghi con un rischio particolarmente elevato di furti - per ogni giorno e a distribuire le pattuglie di conseguenza.

Lo squilibrio rende più difficile l'apprendimento

Finora, tuttavia, questi sistemi di allarme funzionano solo nelle aree densamente popolate, cioè principalmente nelle città. Questo perché i programmi informatici hanno bisogno di dati sufficienti per poter riconoscere i modelli. Gli incidenti criminali sono più rari nelle aree rurali e scarsamente popolate. Le statistiche parlano di "squilibrio di classe". In concreto, ciò significa che per ogni tratto di strada con un furto con scasso, ce ne sono diverse centinaia o addirittura 1000 senza.

Gli algoritmi lavorano in parallelo

Cristina Kadar è un'informatica e dottoranda presso il Dipartimento di Management, Tecnologia ed Economia. Ha sviluppato un metodo in grado di fare previsioni affidabili nonostante la distribuzione disomogenea dei dati. Ha appena pubblicato il suo lavoro sulla rivista pagina esternaSistemi di supporto alle decisioni prima. Utilizzando un ampio set di dati sui furti nel cantone di Argovia, il ricercatore ha testato numerosi metodi di apprendimento automatico, combinandoli tra loro e confrontando le percentuali di successo. Il metodo più accurato si è rivelato quello che utilizza l'intelligenza di gruppo e combina le analisi di diversi algoritmi.

Nell'apprendimento automatico, un algoritmo utilizza grandi serie di dati per addestrarsi a classificare correttamente i dati. Nell'esempio attuale, l'algoritmo apprende da variabili quali l'ora del giorno, la posizione, la densità di popolazione e molto altro ancora per classificare un certo appezzamento di terreno come a rischio di furto con scasso o meno in un determinato momento.

La sfida consisteva nel riuscire ad addestrare gli algoritmi di classificazione nonostante il numero ridotto di casi di furto con scasso presenti nel set di dati. A questo scopo Kadar ha elaborato il set di dati: Le unità senza intrusioni sono state rimosse in modo casuale fino a quando le unità con e senza intrusioni sono state bilanciate. Questo metodo statistico è chiamato "sottocampionamento casuale". Kadar ha utilizzato questo set di dati ridotto per addestrare numerosi algoritmi di classificazione in parallelo. Le loro previsioni aggregate hanno dato origine alla previsione dei furti. Kadar ha utilizzato come unità di dati delle parcelle di 200 metri per 200 in un giorno specifico.

Mentre i sistemi di allarme convenzionali utilizzano principalmente i dati sulle effrazioni, Kadar ha alimentato gli algoritmi di classificazione anche con dati demografici aggregati impersonali, ad esempio sulla densità della popolazione, la struttura dell'età, il tipo di edificio, l'infrastruttura (presenza di scuole, ecc.) edensità della popolazione, struttura dell'età, tipo di edificio, infrastrutture (presenza di scuole, stazioni di polizia, ospedali, strade), vicinanza ai confini nazionali o con dati temporali come i giorni della settimana, i giorni festivi, la luce del giorno e persino la fase della luna.

Tasso di successo migliore rispetto alle città

Con il nuovo metodo, Kadar è riuscita a migliorare significativamente la percentuale di successo rispetto ai metodi convenzionali. Ha fatto utilizzare al computer il suo metodo per prevedere i luoghi in cui è probabile che si verifichino furti nel cantone (hotspot). Il test ha dimostrato che circa il 60% dei furti effettivi sono stati commessi nei punti caldi previsti. In confronto: se i punti caldi sono stati previsti con il metodo convenzionale utilizzato dalla polizia, solo il 53% dei furti effettivi ha avuto luogo nella regione prevista. "Con dati distribuiti in modo disomogeneo, il metodo raggiunge tassi di successo almeno altrettanto buoni e in alcuni casi migliori rispetto ai metodi convenzionali nelle aree urbane, dove i dati sono più densi e distribuiti in modo più uniforme", spiega Kadar.

Questi risultati sono utili soprattutto per la polizia. Il metodo può essere utilizzato anche per prevedere le regioni e gli orari con un maggior rischio di furti nelle aree meno densamente popolate. Tuttavia, sarebbe possibile utilizzare il metodo anche per prevedere altri rischi: I rischi per la salute, ad esempio, o la probabilità di chiamate di emergenza in ambulanza. Anche gli Immobili potrebbero utilizzare il metodo per prevedere l'andamento dei prezzi delle proprietà in base a fattori spaziali.

Riferimento alla letteratura

Kadar C, Maculan R, Feuerriegel S: Supporto alle decisioni pubbliche per le aree a bassa densità di popolazione: un hyper-ensemble consapevole degli squilibri per la previsione della criminalità spazio-temporale. Decision Support Systems, 2019, doi: pagina esterna10.1016/j.dss.2019.03.001

JavaScript è stato disattivato nel vostro browser