Hvordan tweets gir supernøyaktige morgentrafikkforutsigelser

"Det er veldig spennende å se at denne metoden fører til bedre spådommer om morgenpendeltrafikk så sent som klokken 5, og jeg tror dette raskt kan implementeres i mange av våre transportledelsessentre," sier Sean Qian. (Kreditt: Shutter Runner / Flickr)

Forskere har brukt informasjon hentet fra tweets for å gi enestående nøyaktighet for å forutsi morgentrafikkmønstre.

Morgenpendlingsperioden er en av de travleste tider på dagen for trafikk; det har imidlertid også vist seg å være den vanskeligste tiden å forutsi trafikkmønstre. Dette er fordi de fleste metoder for trafikkforutsigelse er avhengige av å ha en jevn flyt av trafikkdata fra tiden frem til den forventede perioden.

Flertallet av mennesker bruker imidlertid tiden før deres pendle sover eller utfører morgenrutinene hjemme, og etterlater et stort gap i prediktiv trafikkdata.

Forskernes metode løser dette problemet ved å hente data fra tweets sendt mellom kvelden før og tidlig morgen påfølgende dag. De brukte først Twitters applikasjonsprogrammeringsgrensesnitt (API) for å identifisere tweets innenfor et gitt område (i dette tilfellet byen Pittsburgh) med geotags som indikerer hvor de ble sendt. De brukte deretter et annet program kalt Twint, en nettskrape, som trakk andre innlegg fra brukere med geotaggede tweets, for å skape et bedre bilde av tiden og det generelle området som brukeren var aktiv i. All data ble anonymisert og fratatt all personlig identifiserbar informasjon før publisering.


innerself abonnere grafikk


"Vi hevder at tweets fanger opp tre typer nyttig informasjon for å forklare morgendagstrafikk neste dag, som inkluderer folks søvnvåknestatus, lokale hendelser og (planlagte) trafikkhendelser," forfattere Sean Qian, lektor i sivil- og miljøteknikk og Weiran Yao, Qians doktorgradsstudent, skriver.

Videre utvidelse av dette datasettet tillot forskerne å hente ut ytterligere informasjon. Ved hjelp av språkanalyse identifiserte teamet søkeord som kan indikere en trafikkhendelse. Dette inkluderer ikke bare ulykker, men også planlagte stengninger eller store arrangementer som konsert, sportsspill eller høytidsfeiring.

Enkle personlige tweets som "Hadde det kjempegøy på Pirates-spillet!" eller "Denne skjermbenderen fremover kommer til å gjøre meg sent," kan faktisk gi viktig informasjon, spesielt når den er merket med en geotag eller informert av andre tweets fra den brukeren. Ytterligere data ble også hentet fra offisielle kontoer, for eksempel nyheter og lokale myndigheter, som ofte tvitrer direkte rapporter om ulykker og planlagte nedleggelser.

Når de kombineres, gir disse metodene et stort datasett med informasjon som antydet den geografiske fordelingen og sannsynligheten for søvn / våken pendlere, samt både planlagte og utilsiktede trafikkhendelser som kan påvirke deres pendling. Dette broet informasjonsgapet som ble opprettet av nattetid i trafikken.

Med denne informasjonen var Qian og Yao i stand til å gi trafikkspådommer for Pittsburghs morgenpendlingsperiode med tidligere usett nøyaktighet, og har skapt et omfattende rammeverk for å forutsi morgentrafikkforhold i urbane områder.

Denne informasjonen gjør det også mulig for dem å begynne å gjøre observasjoner og spådommer på en større, daglig-skala. Dette inkluderer å finne at morgentrafikken i Pittsburgh generelt var mer overbelastet på tirsdager, onsdager og torsdager, noe som kunne gjøre transportbyråene bedre i stand til å håndtere morgenpendlingen. Denne typen observasjoner - som tidligere var umulige på grunn av manglende evne til å forutsi nøyaktige morgenforhold - kan informere større beslutninger om styring av reisebehov, signalstyring og personlig destinasjonsruting.

"Denne undersøkelsen utnytter maskinlæring og big data for å forstå menneskelig atferd og samtidig bevare individets privatliv," sier Qian.

"Det er veldig spennende å se at denne metoden fører til bedre spådommer om morgenpendlingstrafikk så sent som klokken 5, og jeg tror dette raskt kan distribueres i mange av våre transportledelsessentre."

Om forfatterne

Resultatene deres vises i Transportforskning. - Original Studie

bryte

Relaterte bøker:

Atomvaner: En enkel og påvist måte å bygge gode vaner på og bryte dårlige

av James Clear

Atomic Habits gir praktiske råd for å utvikle gode vaner og bryte dårlige, basert på vitenskapelig forskning på atferdsendring.

Klikk for mer info eller for å bestille

De fire tendensene: De uunnværlige personlighetsprofilene som avslører hvordan du kan gjøre livet ditt bedre (og også andres liv bedre)

av Gretchen Rubin

De fire tendensene identifiserer fire personlighetstyper og forklarer hvordan det å forstå dine egne tendenser kan hjelpe deg med å forbedre relasjonene, arbeidsvanene og den generelle lykke.

Klikk for mer info eller for å bestille

Tenk om: Kraften i å vite hva du ikke vet

av Adam Grant

Think Again utforsker hvordan folk kan endre mening og holdninger, og tilbyr strategier for å forbedre kritisk tenkning og beslutningstaking.

Klikk for mer info eller for å bestille

Kroppen holder poengsummen: Hjerne, sinn og kropp i helbredelsen av traumer

av Bessel van der Kolk

The Body Keeps the Score diskuterer sammenhengen mellom traumer og fysisk helse, og gir innsikt i hvordan traumer kan behandles og helbredes.

Klikk for mer info eller for å bestille

The Psychology of Money: Tidløse leksjoner om rikdom, grådighet og lykke

av Morgan Housel

The Psychology of Money undersøker måtene våre holdninger og atferd rundt penger kan forme vår økonomiske suksess og generelle velvære.

Klikk for mer info eller for å bestille