Snakk med meg Computer: Stemmekontrollen tar av

Hvis uventede pakker begynner å dukke opp på døren, vil du kanskje ha et ord med en av de smarte enhetene dine.

Tidligere i måneden spurte en seks år gammel i Dallas hennes familie Amazon Echo smart høyttaler for et dukkehus. Og Alexa, Amazons Siri-lignende kunstig assistent, straks bestilte en til deres hus.

En San Diego TV-nyhetsshow plukket opp historien, og utilsiktet gjentok den da en av nyhetsankrene kommenterte: "Jeg elsker den lille jenta, sier" Alexa bestiller meg et dukkehus "." Overhearing dette, flere andre Amazon-enheter i hjemmet over San Diego forsøkte å kjøpe flere dukkehus.

CW6 San Diego nyhetsrapport om Alexa's utilsiktede dukkehus kjøp.

{youtube}oI2KLIULjXc{/youtube}

Historien kan høres utrolige kjent for alle som har prøvd å ha en samtale med Apples Siri eller Microsofts Cortana. Våre enheter har blitt ganske gode til å lytte til oss, men det betyr ikke alltid at de forstår.

Forskere fra Microsoft har nylig oppdaget dette som et potensielt problem med dagens snakkes grensesnitt: De markedsføres som "intelligente" assistenter, med gode vitser og verdslige kunnskaper, men de frustrer oss ofte med mangel på sunn fornuft.


innerself abonnere grafikk


I en liten studie, fant forskerne at folkene som fortsatte å snakke med sine digitale assistenter over tid var de som hadde startet med de laveste forventningene.

Hva gjør et stemmeinterface faktisk?

Når du snakker med et taleinterface, må det:

  • "Hør" lyden av stemmen din og skille den fra bakgrunnsstøy
  • finne ut hvor hvert ord begynner og slutter, ignorerer "umms" og "ahhs"
  • Match lyden til hvert ord til et ord i ordboken, og velg den rette fra kontekst hvis det er homophones
  • korrekt tolke meningen med hele setningen
  • generer en meningsfull og nyttig respons som samsvarer med forespørselen din.

Hver av disse er en kompleks teknisk utfordring, og ulike teknologibedrifter har gjort fremskritt på forskjellige områder.

Google Nå er godt å gi relevante svar på en rekke forespørsler fordi den drar nytte av Googles data om Internett og dine personlige aktiviteter, hvis du bruker Google-tjenester.

Amazon Echo er spesielt godt å høre dine forespørsler fra over et støyende rom, takket være en støyreduserende langtfelt mikrofon array. Selvfølgelig er det også bra å kjøpe gjennom Amazon.

I løpet av de siste årene har taleinterfaces blitt mye bedre til å forstå hverdags- eller "naturlig" tale snarere enn bare stilte og nøye ordnede kommandoer. De er fortsatt bedre til å håndtere enkle spørringer, som "hvem spiller i Australian Open?", Og har en tendens til å slite med mer kompliserte forespørsler, som "hvem spiller i Australian Open for første gang i år?" Og oppfølging Spørsmål, som "vil det regne i finalen?".

Situasjonen er enda mer blandet for andre språk enn engelsk: mens Siri støtter mer enn 40 språk og dialekter, er Alexa enda tilgjengelig bare på engelsk og tysk. Men alle disse funksjonene er stadig bedre.

Der stemmegrensene stikker

Så vil taleinterfaces snart overta all vår teknologi, som spådd i filmen Her? Gartner, et teknologiforskningsfirma, har prognostisert at neste år vil 30% av våre samspill med teknologi bli samtaler med stemmeaktiverte grensesnitt.

Men taleinterfaces har begrensninger, og ikke alle av dem kan løses av bedre teknologi.

Stemme er et sentralt middel for å knytte sammen med teknologi i Spike Jonze's film Hennes.

{youtube}ne6p6MfLBxc{/youtube}

Støyforurensning er en stor hindring. Kan enheten skille mellom hva du sier fra bakgrunnsstøyen rundt deg? Teknologi kan hjelpe med det, blant annet støyreduksjon, personlig talegjenkjennelse og leppeavlesning.

Men hva med bakgrunnsstøy du lager for andre ved å snakke med smart enhet? Tenk deg at en person sitter ved siden av deg på kontoret - eller på et fly - chatter med Siri mens du prøver å lese, og du kan se hvorfor stemmeinterfaces kanskje ikke alltid er sosialt akseptable.

Et annet sett av problemer kommer fra de mentale kravene til talegrensesnitt. Lære å bruke et stemmebasert system kan være vanskelig, spesielt hvis det ikke er noen skjerm, som med Amazon Echo.

Hvis du noen gang har ringt opp en bank eller et telefonselskap, vet du den elendige kombinasjonen av konsentrasjon og kjedsomhet som kommer fra å lytte til en syntetisert taleliste ut alle alternativene dine mens du venter på den du trenger og prøver å ikke blande dem opp. Tradisjonelle grafiske grensesnitt unngå dette problemet ved å vise deg de tilgjengelige alternativene og la deg raskt trykke på ditt valg.

Når du har lært talekommandoer, kan det være distraherende å bruke dem. Forskere har funnet ut at stemmekommandoer sperre tankegangen din mer enn en mus og et tastatur.

Dette er spesielt farlig for bilstereointerfaces: et par studier fra University of Utah fant at sjåførene var distraheres i opptil 27 sekunder etter bruk av talekommandoer.

University of Utah / AAA Foundation for Trafiksikkerhetsforskning på førerdistraksjon.

{vimeo}108281698{/vimeo}

Finne sin stemme?

Så det er ikke sannsynlig at talegrensesnitt vil overta helt, men de vil finne nyttige nisjer i våre liv. De er allerede vanlige i biler, hvor de forhåpentligvis blir mindre distraherende etter hvert som teknologien forbedrer seg.

På kjøkkenet kan du spørre Alexa om å snakke deg gjennom en oppskrift eller oppdatere handlelisten mens hendene dine er opptatt med matlaging. I virtuell og forstørret virkelighet kan talegrensesnittene gi deg kontroll over systemet når du ikke kan se hendene dine i det hele tatt.

I språkopplæring kan de brukes til å utøve uttale. Viktigst av alt, støtter grensesnittene brukere med nedsatt funksjonsevne, RSI eller dysleksi for å overvinne funksjonshemminger.

Taleinterfaces er en etterlengtet teknologi, og det er gode grunner til å tro at deres tid endelig er kommet. Bare husk at de kanskje ikke er så kloge som de høres ut. Og du vil kanskje sette inn en PIN-kode på stemmekjøp hvis barn er rundt.

Den Conversation

Om forfatteren

Fraser Allison, PhD-kandidat i Human-Computer Interaction, University of Melbourne

Denne artikkelen ble opprinnelig publisert på Den Conversation. Les opprinnelige artikkelen.

Relaterte elementer

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market og Amazon