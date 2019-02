Her i Europa er vi inne i personvernets tidsalder. Vi har innført lover som gjør at vi alle skal begrense datamengden vi samler inn, oss forskere inkludert.

Vi opplever datatørke, og det i en tid hvor forskere trenger data mer enn noen gang.

Langt der borte finnes et land som flyter over av vår tids melk og honning: data. Et land der personvern nærmest ikke finnes. Landet er Kina.

Økende databehov

Jeg forsker på dataprogrammer som lærer av seg selv, såkalt kunstig intelligens. Det er i korte trekk dataprogrammer som ikke er programmert i detalj av noen utviklere, men som isteden har blitt trent opp med å gi store mengder data.

Vi kaller ofte disse dataprogrammene for algoritmer, og data er kjernen i nær sagt alle kunstig intelligens-algoritmene. Forskere kan for eksempel mate inn mengder av bilder av hudkreftceller og den kunstige intelligensen finner selv ut hvordan den skiller mellom ondartede og godartede, og den gjør det bedre enn trente leger.

Verden er inne i et digitalt kappløp som handler om å lage gode algoritmer.

Dette gjør ikke legene arbeidsløse, men gir nye muligheter for pasientene. Vi kan om få år se for oss individualisert presisjonsmedisin basert på algoritmer trent opp med data fra hver og en av oss.

Det kommer trolig ikke til å bli norske algoritmer. Vi mangler data.

Det digitale diktatur

For ikke lenge siden jobbet jeg med noen kollegaer med å lage forklarende algoritmer. Dagens beste algoritmer er veldig gode til å diagnostisere, men det er vanskelig å forstå hvorfor algoritmene har tatt de avgjørelsene de har tatt. De er som svarte bokser vi ikke kan se inn i. For å få forsket frem slike forklarende algoritmer trengte vi data. Mye data. Det hadde vi ikke.

Morten Goodwin Foto: NRK Sorlandet / NRK Sorlandet

Jeg ble sittende og banne til mine kollegaer over datatørken. «Jeg vet hvor du kan få tak i data», sa en av mine kinesiske kollegaer. «Jeg kjenner en professor fra mitt universitet som kan sende deg masse data, bare gi meg e-posten din så får du det i løpet av noen dager».

Slik kunne jeg få tak i nøye kategoriserte bilder av kreftceller, akkurat det mine algoritmer tørstet etter. Jeg har aldri vært så fristet i min akademiske karriere.

Jeg takket nei til tilbudet. Kanskje var det en ryggmargsrefleks. Jeg har ingen anelse om hvordan dataene er samlet inn, eller om pasientene har samtykket. Ideen om forklarende medisinske algoritmer ble lagt på hylla på grunn av datatørke.

Vi kan om få år se for oss individualisert presisjonsmedisin basert på algoritmer.

I Kina sitter det utvilsomt forskere og bruker akkurat de samme dataene den dag i dag. Algoritmene de lager blir stemplet «made in china», og de vil være bygget med kinesisk etikk, moral og personvern, eller snarere mangel på personvern.

Fri flyt

Forskningsfronten i kunstig intelligens ligger ikke lenger i akademia. Mange av store fremskrittene kommer fra de store amerikanske firmaene som Google og Facebook. Fordi de har tilgang til akkurat det algoritmene trenger: Data og datakraft. De er ikke alene om den fordelen.

Det kinesiske kommunistpartiet vil at Kina skal dominere kunstig intelligens-verden innen 2030. Det er bare 11 år til. Et eksempel er firmaet Baidu, Kinas google, som nylig lagde en algoritme for å assistere legers medisinske beslutninger.

De har utvilsomt hatt rikelig med data for å trene opp algoritmen. Data som vi europeere mangler. I Kina flyter data som melk og honning, og de produserer flere vitenskapelige artikler enn noe annet land.

Feil venner? Ingen kreditt

Den heldigitale kinesiske banken WeBank har forsket frem algoritmer som bestemme om borgere skal få lån. Banken har ikke lyst til å gi lån til folk som ikke kommer til å betale, naturlig nok. Lignende algoritmer har vi i Norge også. Hvis jeg er en dårlig betaler som har misligholdt lån flere ganger, er sjansen for at jeg får et nytt stort lån minimal.

Digitalisering alene er helt unyttig.

WeBank har gått mye lenger, fordi de har lov til å gå mye lenger. Jeg snakket med en forsker i WeBank på en konferanse for en stund siden. De forsøkte å rekruttere kunstig intelligens-forskere, og salgsargumentet var deres tilgang til data. «We believe that bad people have bad friends. They should not have loan. Therefore we collect data about them» var argumentasjonen. WeBank gav ut 100 millioner lån i fjor, og lånene gis basert på data samlet av kundene.

Nå vil de ha flere forskere, og de var ikke eneste som forsøkte å rekruttere forskere på den konferansen. Ved siden av dem sto JD.com («kinesiske Amazon»), DiDi («kinesiske Uber»), RenRen («kinesiske Facebook»), og mange fler.

Den norske løsningen

Verden er altså inne i et digitalt kappløp som handler om å lage gode algoritmer. Norge vil tydeligvis være med, vi har jo fått en egen digitaliseringsminister.

Sannheten er at digitalisering alene er helt unyttig. All denne digitaliseringen må ha et mål, og det har de i Kina. De lager algoritmer som fungerer med data.

Det trenger ikke være en motsetning mellom personvern og innsamlet data.

Vi er inne i et digitalt kappløp som Norge har all grunn til å være med på. Det er et kappløp som handler mye om tilgangen til data.

Kineserne har planer om å samle sine data i en stor database. Det kan vi gjøre også, men vi kan gjøre det med norsk etikk og moral.

Det trenger ikke være en motsetning mellom personvern og innsamlet data. Dataene kan være lukket og anonymisert. Her kan vi samle på medisinsk data, sykdomsspredning, banktransaksjoner. Vi forskere kan få tilgang.

Neste gang min kinesiske kollega tilbyr data, tviler jeg på at jeg klarer å motstå fristelsen.

Les også: