Hvordan Internett vet om du er glad eller trist

glad eller trist 5 28

Tenk på hva du delte med vennene dine på Facebook i dag. Var det følelser av "stress" eller "fiasko", eller kanskje "glede", "kjærlighet" eller "spenning"? Hver gang vi legger ut på sosiale medier, forlater vi spor av vårt humør. Den Conversation

Våre følelser er verdifulle varer, og mange bedrifter utvikler automatiserte verktøy for å gjenkjenne dem i en prosess kjent som sentimentanalyse.

Nylig en lekket rapport avslørt at Facebook kan identifisere når unge føler seg sårbare, selv om selskapet har insisterte på at den ikke brukte analysen å målrette brukere med annonsering. Facebook også apologized i 2014 for en eksperiment på "følelsesmessig smitte" der innlegg med enten "positive" eller "negative" følelser ble filtrert fra brukernes feeds.

Det er klart at evnen til å oppdage følelser fra tekst er av stor interesse for sosiale medier, samt annonsører. Men hvordan fungerer sentimentanalyse, hvorfor er det nyttig og hva er farene?

Hvordan fungerer sentimentanalyse?

Mens detaljene i Facebooks egen algoritme ikke er kjent for offentligheten, faller de fleste sentimentanalyse teknikker inn i to kategorier: overvåket eller ukontrollert.

Overvåket metoder er avhengige av merkede data. Med andre ord, disse er innlegg som er klassifisert manuelt som inneholder positiv eller negativ følelse.

Statistiske metoder brukes da til å trene modeller for å klassifisere nye innlegg automatisk basert på tilstedeværelse av pre-identifiserte ord eller uttrykk, for eksempel "stresset" eller "avslappet".

Unsupervised metoder, derimot, stoler ofte på å bygge en ordbok av poeng for forskjellige ord. En slik ordbok utviklet av mine samarbeidspartnere ba folk om å gi en 1 til 9 lykke score til forskjellige ord, og deretter gjennomsnittet resultatene: "rainbows", for eksempel, gjorde 8.06, mens "ubrukelig" får 2.52.

Den generelle følelsen av et uttrykk kan da bli scoret ved å se på alle ordene i innlegget. For eksempel, den gjennomsnittlige poengsummen for innlegget "Min mamma sa alltid" livet er som en boks med sjokolade "" er et over gjennomsnittet 6.02 i henhold til denne ordlisten, og foreslår at det uttrykker en positiv følelse.

Hva brukes sentimentanalyse til?

Sentimentanalyse brukes i økende grad av markedsførere til studere trender og lage produktanbefalinger.

Tenk deg at en ny mobiltelefon er utgitt; En følelsesanalyse av sosiale medier innlegg om telefonen kan gi et selskap verdifull, sanntids innsikt i hvordan den utfører.

Det er bredere bruksområder av sentimentanalyse. Forskere har nylig spores Donald Trumps Twitter-stemning over de første 100-dagene i presidentskapet hans og bygget bots for å plassere markedet handler når han tweets positivt eller negativt om bestemte selskaper.

Forskere kan spore emosjonelle trender i andre tekster også. For eksempel brukte vi følelsesanalyse til å studere følelsesmessige buer av mer enn 1,000-filmer gjennom deres skjermer. Buen på 2013 Disney film Frozen er vist nedenfor.

privatliv Emosjonell lysbuen for filmen Frossen.

Mange filmer viser lignende mønstre: vanlige topper og tregninger av spenning og utløsning, etterfulgt av en spesielt stor gjennomgående 80% av veien gjennom filmen (alt håp er tapt!), Før endelig oppløsning og god slutt. Ved å bruke en lignende analyse til romaner, viste vi det De fleste historier følger en av seks grunnleggende historiebuer.

Vi er fortsatt ikke så gode på sentimentanalyse

Gitt at sentimentanalyser ofte er avhengige av gruvedrift av sosiale medier, reiser det store etiske bekymringer, og denne debatten er bare begynnende. Men den komplekse naturen av språk og mening gjør det utsatt for feil.

Ta uttrykket "Kan kraften være med deg", som skårer 5.35 ved hjelp av vår ordboks analyse. For enhver Star Wars-fan er det selvfølgelig et enormt positivt uttrykk, men det ble beskjedent i vår test fordi ordet "force" er klassifisert som en gjennomsnittlig 4.0.

Dette er forståelig når man vurderer dette ordet i isolasjon, men i sammenheng gjør det mindre sanselig.

Noen skepsis om gyldigheten av Facebooks sentimentanalysemuligheter er derfor berettiget. Det er helt tenkelig å beskrive noe som "fullt syke" på Facebook, et uttrykk for samtalevilkår, kan føre til at en persons følelsesmessige tilstand blir misclassified.

For å forstå når følelsesanalyse gjør og ikke fungerer, er det viktig å undersøke ordene som gir bestemte resultater.

For å gjøre dette bruker vi "ordskift"Diagrammer, som den nedenfor for Frosne. Dette viser hvilke ord som gjorde klimakset på manuskriptet tristere enn det lykkelige slutter: flere referanser til "tristhet" og "frykt", men merkelig, mer "vakker".

privatliv Plot sammenligne klimaks av Frozen til sin lykkelige slutt. De blå stolpene mot toppen av diagrammet viser de øverste bidragsordene til forskjellen i poengsummen.

Løfte og en advarsel

Sentimentanalyse er et kraftig verktøy, men det er bare en ung vitenskap og må brukes med forsiktighet.

Forskere må utvikle verktøy som gjør at vi kan peer "under the hood" og forstå hvorfor enkelte algoritmer produserer resultatene de gjør. Dette er den eneste måten å diagnostisere problemer med ulike metoder, og enda viktigere, å utdanne publikum om feltets muligheter og begrensninger.

Sentimentanalysforskning er i stor grad bygget på store, offentlige datasett, spesielt fra sosiale medier. Det er viktig de av oss som uvitende gir dataene forstå hva det kan og ikke kan brukes til, og hvordan.

Om forfatteren

Lewis Mitchell, foreleser i anvendt matematikk, University of Adelaide. Michelle Edwards bidro til denne artikkelen.

Denne artikkelen ble opprinnelig publisert på Den Conversation. Les opprinnelige artikkelen.

Relaterte bøker:

{amazonWS: searchindex = Bøker; søkeord = Internett-personvern; maxresults = 3}

enafarzh-CNzh-TWnltlfifrdehiiditjakomsnofaptruessvtrvi

følg InnerSelf på

facebook-ikonettwitter-iconrss-ikonet

Få den siste via e-post

{Emailcloak = off}