Trasformare le tracce GPS per pianificazione e servizi
Capire veramente come si muova una città significa andare oltre la semplice somma degli spostamenti.
Un recente studio condotto su queste analisi mette a fuoco un passaggio chiave: usare grandi volumi di dati GPS capaci di alimentare modelli di domanda basati sulle attività, spostando in questo modo l’attenzione dal “come si viaggia” al “perché ci si sposta”.
Un cambio di prospettiva utile per chi governa e decide la mobilità urbana, perché in grado di consentire una lettura delle routine quotidiane e delle catene di decisioni che un modello tradizionale trip based tende a spezzare, considerando gli spostamenti come semplici e mere tratte isolate che portino da punto A ad punto B.
Dai ping GPS ai diari di mobilità. Costruire una base dati affidabile
Per decenni, le indagini sugli spostamenti tramite questionari sono state alla base della pianificazione.
Restano preziose, ma portano limiti dichiarati: costi elevati, tempi lunghi e distorsioni dovute alla memoria degli intervistati, il cosiddetto recall bias. La ricerca mostra come i dati GPS, raccolti da provider e anonimizzati, offrano un vantaggio di scala e precisione.
Un caso lo si trova sullo studio condotto sulla città metropolitana di Milano, si parla di 100 milioni di ping e quasi un milione di utenti osservati per un mese, tra metà novembre e metà dicembre 2024.
Questi dati richiedono una pulizia accurata.
Il lavoro che viene compiuto ha lo scopo di andare a rimuovere i profili con pochi ping sparsi, per poi raffinarlo ulteriormente, portando in questo modo, rispetto ai dati iniziali, una riduzione delll’82% del campione e un nucleo finale di 17.000 diari di mobilità ricostruibili.
Il passaggio metodologico centrale è distinguere, dentro una sequenza caotica di punti GPS, ciò che è spostamento da ciò che è sosta, cioè attività.
Le soglie fisse di tempo o velocità tipiche dei metodi tradizionali non funzionano bene quando i ping sono irregolari. In questo un valore aggiunto può essere rintracciato nel programma DBSCAN, un algoritmo di clustering innovativo.
Ciò che il programma fa è di andare ad applicare l’algoritmo a coordinate pesate dalla velocità tra un punto e il successivo.
Nello schema che si viene così a creare i punti di viaggio, più veloci e dispersi, finiscono in cluster, mentre i punti di sosta, con velocità quasi nulla e maggiore densità, vengono classificati come noise.
L’intuizione è ribaltare il significato: qui l’anomalia passa dall’essere considerato errore a divenire il segnale dell’attività. Per aumentare la robustezza di quanto raccolto intervengono poi ulteriori correzioni e post elaborazioni, come la tecnica K Nearest Neighbors.

Segmentazione, scenari e test delle politiche di mobilità
Per arrivare alle motivazioni che sono alle base degli spostamenti serve interpretare la destinazione.
La classificazione avviene su due livelli.
Nel primo livello si hanno tre macro categorie, Casa, Attività principale e Attività secondaria, definite con parametri di tempo e frequenza. Poi su un secondo livello si ha un piano di dettaglio ottenuto integrando i dati provenienti dall’uso del suolo.
Le soste vengono sovrapposte incrociandole alle informazioni date da banche dati cartografiche e informative sul territorio (OpenStreetMap).
Quello che si viene così a definire è una catchment area capace di coprire il 98% delle attività identificate e processando circa 1,2 milioni di edifici e 224.000 punti di interesse.
In questo modo, una sosta lunga in un’area universitaria può essere letta come uno Studio, mentre una sosta in un’area con uffici come Lavoro.
Resta però un punto importante per chi decide: le mappe di uso del suolo possono avere lacune e ambiguità, quindi la macro classificazione iniziale è decisiva per evitare interpretazioni fuorvianti.
Da qui si passa alla segmentazione degli utenti, superando l’idea dei viaggiatori medi. Analizzando pattern ricorrenti, emergono profili come lavoratore a tempo pieno, part time, studenti universitari o di scuola secondaria, e un gruppo non lavoratore o pensionato, con limiti espliciti dovuti all’assenza di dati anagrafici.
L’approccio permette comunque di ricostruire comportamenti distinti su larga scala, senza recall bias.
Il valore capace di essere un valore aggiunto per la pubblica amministrazione sta nell’uso che di questi dati ne può fare. Queste metodologie possono entrare nella cassetta degli attrezzi della pianificazione e alimentare piattaforme di simulazione capaci di costruire un gemello digitale della popolazione osservata.
In questo modo diventa più realistico testare come le città reagirebbero rispetto alle nuove linee metropolitane, ai servizi riprogettati, e agli incentivi; oppure andando ad ottimizzare gli orari del trasporto pubblico e pianificando le infrastrutture ciclabili in modo mirato.
La condizione, implicita in tutto il lavoro, è trattare i dati come infrastruttura: qualità, pulizia, integrazione e capacità di lettura diventano parte della decisione, non un passaggio tecnico accessorio.

Fonti:
https://datamobility.it/magazine/decodificare-il-ritmo-delle-citta-con-i-dati-gps/
Ben-Akiva, M.E., Bowman, J.L. (1998). Activity Based Travel Demand Model Systems. In: Marcotte, P., Nguyen, S. (eds) Equilibrium and Advanced Transportation Modelling. Centre for Research on Transportation. Springer, Boston, MA.
https://doi.org/10.1007/978-1-4615-5757-9_2




