Når «big tech» blir best på personvern
Teknologigigantene overvåker deg for å lage programvaren du vil ha. Snart blir denne overvåkningen unødvendig.
Om du lader telefonen din imens du sover, betyr ikke det at telefonen slapper av. «Hei Google,» sier telefonen, «jeg har lært noe nytt siden sist. Vil du høre?».
Hvis Googles server svarer ja, kan selskapets store modeller lære av det mobilen din har lært.
Det fascinerende er at dette kan skje uten at en eneste personopplysning, eller for den del, en eneste bit med rådata når frem til dem som lager programvaren. Det er altså mer personvernvennlig enn selv GDPR-praksis krever i dag.
Blant annet Google har allerede begynt å bruke og videreutvikle denne teknologien, og vi bør snart forvente det samme fra norske databehandlere.
Når tastaturet på telefonen din foreslår hvilket ord du skal skrive, er det fordi det har fulgt med på utallige setninger som er blitt har skrevet før, og lært seg et mønster. Deler av mønsteret kommer fra andre brukere, og deler kommer fra din egen bruk.
Teknologien bruker maskinlæring, og hvis det ikke gjøres med omhu kan resultatet bli personopplysninger på avveier: Amerikanske forskere har vist hvordan de kunne hente ut adresser og telefonnumre fra en åpent tilgjengelig maskinlæringsmodell – uten tilgang til dataene den ble utviklet på.
Ved hjelp av det som kalles differensielt personvern blir det umulig å hente ut unike opplysninger om enkeltbrukere.
Den gode nyheten er at disse blir tatt i bruk på telefonen din i økende grad. Enkelt forklart legges det inn små mengder tilfeldig støy i modellene slik at de blir litt dårligere. Resultatet er at ingen kan finne ut hvilken rolle akkurat du spilte for utviklingen av modellen. Derfor ville de heller ikke greid å hente ut opplysninger om deg.
Modellen lærer seg å skrive meldinger fra dine, men dersom akkurat din melding blir foreslått av telefonen, er det kun fordi mange har skrevet det samme.
Enhver som behandler persondata kan bli en trussel mot ditt og mitt personvern. Om de oppfører seg annerledes i morgen enn i dag, utsettes for et angrep eller blir kjøpt opp, kan dataene bli misbrukt. Derfor krever GDPR at man kun behandler akkurat de dataene man trenger, og bare når man trenger dem.
Teknologien beveger seg nå i en retning der man kan unngå å lagre data, for eksempel ved å utvikle modeller kun på hver brukers telefon. Da deles bare modellen med selskapet – ikke dataene. Deretter settes modellene fra tusenvis av brukere sammen til en helhetlig modell, som distribueres ut til telefonene igjen.
Ingen trenger å lese meldingene du skriver til kjæresten: De kan lære seg å skrive romantiske meldinger uten å lese dine. Dette kalles føderert læring.
Både Google og de andre teknologigigantene behandler fortsatt enorme mengder data om oss, men vi aner en mer privat fremtid. Om ikke lenge bør dette være hovedregelen for alle som vil lære av hva vi brukere gjør.