Kronikk

Kunstig intelligens på norsk, no!

Det norske språkmangfaldet blir utfordra i møte med ny teknologi. Det trengst ein digital dugnad for å sikra breidda i norsk språk i den kunstige intelligensens tidsalder.

Smarthøyttalere

Me må kunne snakke til dei talestyrte assistentane på norsk, meiner kronikkforfattaren. På biletet ser me Google home Amazon Alexa Echo.

Foto: Kristine Sterud / NRK

– Alexa, what will the weather be like tomorrow?

Kunstig intelligens er i ferd med å endra levesettet til folk over heile verda. Dette er ei utvikling som er uløyseleg knytt til språk: Det er enorme mengder språkdata som ligg til grunn for maskinlæringa. Språket har vorte byggjestein i teknologiutviklinga.

Talestyrte hjelparar

Eitt døme er Alexa. Ho møter deg, alltid like venleg, når du «vekkjer» henne med røysta di. Ho er storselskapet Amazons talestyrte personlege assistent, som held til i ein liten, intelligent høgtalar med namnet Amazon Echo. Høgtalaren er kalla opp etter den ulukkelege nymfa Ekko i gresk mytologi, som Hera hadde forbanna til å måtta repetera det andre sa.

Førebels kjem ein til kort med norsk.

Slike talestyrte intelligente hjelparar er i ferd med å bli eit massefenomen. Amazons Echo, Googles assistent og Apples Siri fungerer allereie godt for engelsk. Men førebels kjem ein til kort med norsk. Du må spørja Alexa om the weather når du lurer på korleis vêret eller været blir.

Den norske situasjonen

Somme vil meina at det ikkje er noko stort problem at ein må snakka engelsk i møte med ny teknologi. Eg trur det er eit feilspor. Dei fleste av oss meistrar morsmålet mykje betre enn engelsk. I Noreg må me derfor syta for at me òg kan bruka norsk i ein digital kvardag.

Me har to variantar av skriftspråket vårt og eitt breitt spekter av dialektar. Den store toleransen for variasjon i talt norsk er ein språkleg og demokratisk rikdom som det gjeld å ta vare på. I møte med talestyrt teknologi bør me ikkje gje heilt avkall på den verdien det er å kunna snakka sitt eige mål.

Språket har vorte byggjestein i teknologiutviklinga.

I Noreg har me dessutan to skriftspråk som i prinsippet er jamstilte. Om du er nynorskbrukar, har du nok likevel erfart at det ikkje løner seg å søkja på nynorsk om du er ute etter gode treff på nettet. Med slike mekanismar blir det lite attraktivt å publisera på nynorsk, og det oppstår ein vond sirkel for ei allereie hardt pressa målform.

Dugnad for norsk språkteknologi

For å sikra at norsk språk, med bokmål, nynorsk og brei talemålsvariasjon, skal vera brukande i all slags teknologi, trengst ein dugnad for norsk språkteknologi. Me må trena opp maskinane til å fungera slik me ønskjer.

Det trengst byggjesteinar for å utvikla tale- og språkteknologi. Store mengder tekst trengst som fundament for velfungerande språkteknologi. Når omsetjingstenesta Google translate har vorte mykje betre dei siste åra, er det fordi Google har lukkast med å skapa ein intelligent omsetjar med tilgang til enorme mengder data i form av tekst.

Me må trena opp maskinane til å fungera slik me ønskjer.

Me er eit lite språkområde. Den norske marknaden er ikkje nødvendigvis stor nok til å vera interessant for dei store internasjonale aktørane. Derfor må me saman syta for at norskspråklege ressursar til utvikling av tale- og språkteknologi blir gjort tilgjengelege. Det vil auka sjansen for at det blir laga norske versjonar av denne teknologien.

Språkbanken

Heldigvis har me allereie Språkbanken ved Nasjonalbiblioteket, som best kan skildrast som ein stor kvelv med digitale språkressursar – byggjesteinar som kan brukast av teknologibedrifter og forskingsmiljø når dei skal laga produkt på norsk. Men Språkbanken må stadig oppdaterast etter behova til desse utviklarmiljøa og til samfunnet elles.

Me må saman sikra at norsk blir eit fullgodt bruksspråk i den digitale framtida.

No kan alle ta del i ein nasjonal dugnad for å samla inn data til utvikling av norsk språkteknologi. Statlege organ med stor tekstproduksjon kan avlevera potensielt verdfulle dataressursar til Språkbanken. Private verksemder og privatpersonar som sit på store data, kan gjera det same. Slik kan me saman sikra at norsk i den digitale framtida blir eit fullgodt bruksspråk – som ein sjølvsagd del av ein gjennomdigitalisert kvardag.

Følg NRK Debatt på Facebook og Twitter