online liggende 6 29

Det er tre ting du kan være sikker på i livet: død, skatt - og lyver. Sistnevnte ser ut til å ha blitt båret ut av Storbritannias siste Brexit-folkeavstemning, med en Antall av La kampanjen være løfter ser mer ut i likhet med porkie paier enn faste sannheter.

Men fra internettannonsering, visumapplikasjoner og akademiske artikler til politiske blogger, forsikringskrav og datingprofiler, finnes det utallige steder vi kan fortelle digitale løgner. Så hvordan kan man gå om å spotte disse onlinefibene? Vel, Stephan Ludwig fra University of Westminster, Ko de Ruyter fra City University Londons Cass Business School, Mike Friedman fra Catholic University of Louvain, og du har virkelig utviklet en digital løgnedetektor - og det kan avdekke en hel rekke internettilværdigheter .

I vår nye forskning, brukte vi språklige signaler til å sammenligne titusenvis av e-postmeldinger pre-identifisert som løgner med de som er kjent for å være sannferdige. Og fra denne sammenligningen utviklet vi en tekstanalytisk algoritme som kan oppdage bedrageri. Det fungerer på tre nivåer.

1. Ordbruk

Søkeordssøk kan være en rimelig tilnærming når det gjelder store mengder digital data. Så vi først oppdaget forskjeller i ordbruk mellom de to dokumentene. Disse forskjellene identifiserer tekst som sannsynligvis vil inneholde en løgn. Vi fant at personer som løgn generelt bruker færre personlige pronomen, som jeg, deg og han / hun, og flere adjektiver, for eksempel strålende, fryktløse og sublime. De bruker også færre førstepersoners entall, som jeg, meg, mine, med avviksord, som kunne, skulle, ville, så vel som flere andre personers pronomen (deg, din) med prestasjonsord (tjener, helt , vinn).

Færre personlige pronomen indikerer en forfatters forsøk på å dissociere seg fra deres ord, mens bruk av flere adjektiver er et forsøk på å distrahere fra løgnen gjennom en flurry av overflødige beskrivelser. Færre førstepersoners entall i kombinasjon med avviksord tyder på mangel på subtilitet og et positivt selvbilde, mens flere andre personers pronomen kombinert med prestasjonsord indikerer et forsøk på flattere mottakere. Vi inkluderte derfor disse kombinasjonene av søkeord i vår algoritme.


innerself abonnere grafikk


2. Strukturkontroll

En annen del av løsningen lå i å analysere variansen av kognitive prosessord, som årsak, fordi, vet og burde - og vi identifiserte et forhold mellom strukturord og løgner.

Løgnere kan ikke generere villedende e-poster fra det faktiske minnet, slik at de unngår spontanitet for å unngå deteksjon. Det betyr ikke at løgnere bruker mer kognitive prosessord generelt enn folk som forteller sannheten, men de inkluderer disse ordene mer konsekvent. For eksempel har de en tendens til å koble hver setning til den neste - "vi vet at dette skjedde på grunn av dette, fordi dette burde være tilfelle". Vår algoritme oppdager slik bruk av prosessord i kommunikasjon.

3. Cross-email tilnærming

Vi studerte også måtene som en avsender av en e-post endrer sin språklige stil på, mens han utveksler flere e-post med noen andre. Denne delen av studien viste at etter hvert som utvekslingen gikk, desto mer hadde avsenderen en tendens til å bruke funksjonene som mottakeren brukte.

Funksjonsord er ord som bidrar til syntaksen, eller strukturen, heller meningen med en setning - for eksempel en, er, til. Og sendere revidert den språklige stilen til sine meldinger for å matche mottakerens. Som en konsekvens identifiserer og samler vår algoritme en slik samsvar.

Spennende applikasjoner

Forbrukervakter kan bruke denne teknologien til å tildele en "mulig liggende" poengsum til reklame av tvilsom karakter. Sikkerhetsselskaper og nasjonale grensekrefter kan bruke algoritmen til å vurdere dokumenter, for eksempel visumsøknader og landingskort, for bedre å overvåke overholdelse av tilgangs- og etableringsregler og regler. Sekretærer for videregående eksamenskomiteer og redaktører av akademiske tidsskrifter kan forbedre sine korrekturverktøy for automatisk å sjekke studentoppgaver og faglige artikler for plagiering.

Faktisk går de potensielle applikasjonene videre og igjen. Politiske blogger kan med hell overvåke sine sosiale medier-interaksjoner for tekstuelle anomalier, mens dating- og gjennomgangssider kan klassifisere meldinger sendt av brukere på grunnlag av deres "muligens løgn" -score. Forsikringsselskaper kan bedre bruke sin tid og ressurser til å få krav på revisjon. Regnskapsførere, skatterådgivere og rettsmedisinske spesialister kan undersøke regnskap og skattekrav og finne villedende røykpistoler gjennom vår algoritme.

Mennesker er oppsiktsvekkende dårlige på å bevisst oppdage bedrageri. Faktisk, menneskelig nøyaktighet når det gjelder å oppdage en løgn er bare 54%, neppe bedre enn sjanse. Vår digitale løgnedetektor er i mellomtiden 70% nøyaktig. Det kan legges i arbeid for å bekjempe svindel hvor det forekommer i datastyrt innhold, og ettersom teknologien utvikler seg, kan Pinocchio advarsler være fullstendig automatisert, og dens nøyaktighet vil øke enda lenger. På samme måte som Pinocchios nese reflektert signalisert usannhet, gjør det også vår digitale løgnedetektor. Fibbers pass opp.

Om forfatteren

Den ConversationTom van Laer, Seniorlærer i Markedsføring, City University London

Denne artikkelen ble opprinnelig publisert på Den Conversation. Les opprinnelige artikkelen.

Relaterte bøker

at InnerSelf Market og Amazon