Hvordan kan forskjellig personvern beskytte dataene dine? Marco Verch / Flickr, CC BY 

Tekniske bedrifter kan bruke differensielt personvern til å samle inn og dele aggregerte data om brukervaner, samtidig som personvernet opprettholdes.

Det er ingen hemmelighet at store selskaper som Facebook, Google, Apple og Amazon i stadig større grad infiltrerer våre personlige og sosiale interaksjoner for å samle store mengder data på oss hver dag. På samme tid gjør personvernbrudd i cyberspace regelmessig nyhetssiden.

Så hvordan skal personvernet beskyttes i en verden hvor data samles og deles med økende fart og oppfinnsomhet?

Differensial personvern er en ny modell for nettverkssikkerhet som talsmenn hevder, kan beskytte personlige data langt bedre enn tradisjonelle metoder.

Matematikken den er basert på, ble utviklet for 10 år siden, og metoden har blitt vedtatt av Apple og Google i de senere år.


innerself abonnere grafikk


Hva er forskjell på personvern?

Differensiell personvern gjør det mulig for tekniske bedrifter å samle inn og dele samlet informasjon om brukervaner, samtidig som personvernet til de enkelte brukerne opprettholdes.

For eksempel, si at du ønsket å vise de mest populære ruter folk tar å gå gjennom en park. Du sporer ruter til 100 folk som regelmessig går gjennom parken, og om de går på stien eller gjennom gresset.

Men i stedet for å dele de spesifikke personene som tar hver rute, deler du samlet data samlet over tid. Folk som ser på resultatene dine kan vite at 60 ut av 100 folk foretrekker å ta et kort kutt gjennom gresset, men ikke hvilke 60-personer.

Hvorfor trenger vi det?

Mange av verdens regjeringer har strenge retningslinjer for hvordan tech selskaper samler inn og deler brukerdata. Bedrifter som ikke følger reglene kan møte store bøter. EN Belgisk domstol bestilte nylig Facebook å slutte å samle inn data om brukernes nettleservaner på eksterne nettsteder, eller få bøter på € 250,000 om dagen.

For mange selskaper, spesielt multinasjonale selskaper som opererer i ulike jurisdiksjoner, etterlater dette seg en delikat posisjon når det gjelder innsamling og bruk av kundedata.

På den ene siden trenger disse selskapene brukernes data, slik at de kan tilby tjenester av høy kvalitet som er til fordel for brukere, for eksempel personlige anbefalinger. På den annen side kan de møte kostnader hvis de samler for mye brukerdata, eller hvis de prøver å flytte data fra en jurisdiksjon til en annen.

Tradisjonelle personvernbeskyttende verktøy som kryptering kan ikke løse dette dilemmaet, siden det forhindrer at teknologibedrifter kan få tilgang til dataene i det hele tatt. Og anonymitet reduserer verdien av data - en algoritme kan ikke gi deg personlige anbefalinger hvis den ikke vet hva vanene dine er.

Hvordan virker det?

La oss fortsette eksempelet på turstier gjennom en park. Hvis du kjenner identiteten til de som er inkludert i studien, men du ikke vet hvem som tok denne ruten, kan du antar at personvernet er beskyttet. Men det kan ikke være tilfelle.

Si at noen som ser på dataene dine, vil finne ut om Bob foretrekker å gå gjennom gresset eller på banen. De har fått bakgrunnsinformasjon om de andre 99-menneskene i studien, som forteller dem at 40-folk foretrekker å gå på banen, og 59 foretrekker å gå gjennom gresset. Derfor kan de utlede at Bob, som er den 100te personen i databasen, er den 60te personen som foretrekker å gå gjennom gresset.

Denne typen angrep er et kallt differensiert angrep, og det er ganske vanskelig å forsvare seg da du ikke kan kontrollere hvor mye bakgrunnskunnskap noen kan få. Differensielt personvern tar sikte på å forsvare seg mot denne typen angrep.

Noen som dirigerer din vandringsrute kan ikke høres for alvorlig, men hvis du erstatter turløyper med HIV-testresultater, så kan du se at det er potensial for en alvorlig invasjon av personvern.

Differensiell personvernmodell garanterer at selv om noen har fullstendig informasjon om 99 av 100-personer i et datasett, kan de fortsatt ikke utlede informasjonen om den endelige personen.

Den primære mekanismen for å oppnå det er å legge tilfeldig støy til aggregatdataene. I stieksemplet kan du si at antall personer som foretrekker å krysse gresset, er 59 eller 61, i stedet for eksakt antall 60. Det unøyaktige tallet kan bevare Bobs personvern, men det vil få svært lite innflytelse på mønsteret: rundt 60% foretrekker folk å ta et kort stykke.

Støyen er nøye utformet. Da Apple benyttet differensielt personvern i IOS 10, ble det lagt til støy til individuelle brukerinnganger. Det betyr at den kan spore, for eksempel de mest brukte emojiene, men emoji-bruken av enhver enkelt bruker er maskert.

Cynthia Dwork, den oppfinner av differensial personvern, har foreslått fantastiske matematiske bevis på hvor mye støy som er nok til å oppnå kravet om differensielt personvern.

Hva er dens praktiske applikasjoner?

Differensiell personvern kan brukes på alt fra anbefalingssystemer til stedbaserte tjenester og sosiale nettverk. eple bruker forskjellig personvern å samle anonyme brukerinnsikt fra enheter som iPhones, iPads og Macs. Metoden er brukervennlig og lovlig i det klare.

Ulike personvern vil også tillate at et selskap som Amazon får tilgang til dine personlige shoppingpreferanser, samtidig som du skjuler sensitiv informasjon om din historiske kjøpsliste. Facebook kan bruke den til å samle oppførselsdata for målrettet annonsering, uten å bryte med lands retningslinjer for personvern.

Hvordan kunne den bli brukt i fremtiden?

Ulike land har varierende retningslinjer for personvern, og sensitive dokumenter må øyeblikkelig kontrolleres manuelt før de flytter fra ett land til et annet. Dette er tidkrevende og dyrt.

Nylig et lag fra Deakin University utviklet differensiell personvernsteknologi for å automatisere personvernprosesser innenfor cloud-sharing-fellesskap over land.

Den ConversationDe foreslår at man bruker matematiske formler til å modellere personvernlovene i hvert land som kan oversettes til "middleware" (programvare) for å sikre at dataene overholder. Å bruke differensielt personvern på denne måten, kan beskytte personvernet til brukerne og løse en deling av hodepine for teknologibedrifter.

Om forfatteren

Tianqing Zhu, lektor i cybersikkerhet, Det fakultet for naturvitenskap, ingeniørfag & bygd miljø, Deakin University

Denne artikkelen ble opprinnelig publisert på Den Conversation. Les opprinnelige artikkelen.

Relaterte bøker

at InnerSelf Market og Amazon