Hopp til innhold

Teknologirådet: – Må kunne snakke dialekt til digitale assistenter

Ikke alle synes det er like lett å bli forstått av digitale duppeditter. Men jo viktigere slike verktøy blir, jo viktigere er det at de forstår norske dialekter, mener Teknologirådet.

Frida Pernille Mikkelsen er kommunikasjonsrådgiver i Noregs Mållag og har ikke mye nytte av applikasjoner som Siri i hverdagen.

Frida Pernille Mikkelsen er kommunikasjonsrådgiver i Noregs Mållag og har ikke mye nytte av applikasjoner som Siri i hverdagen.

Det er ikke alltid like lett å bli forstått av digitale verktøy.

Det er erfaringen til Frida Pernille Mikkelsen i Noregs Mållag.

Hun må ta flere runder før Iphone-assistenten Siri endelig forstår at hun søker etter Bykle Arbeiderparti og ikke Beklagerpartiet.

Googles verktøy for transkribering fungerer enda dårligere med Førde-dialekt.

Frida dikterer inn i det automatiske skriveprogrammet:

– Referat frå infonemnda. På møtet var Frida, Vemund og Erik. Første punkt på møtet. Jeg må gjere klar nokre innlegg på situasjonen for hovedmålselevar. Og så er det kongens bursdag, så jeg skulle hatt klar ein gratulasjon til det.

Men teksten blir ikke som den skal. Det blir en grøt.

– Det er jo kjempeeffektivt for meg med dette referatet, ler Mikkelsen.

Alle dialekter er viktige

Hvis alle skal kunne benytte seg av taleteknologi, så må den forstå alle dialekter, mener Teknologirådet.

Deres ekspertutvalg leverte nylig en rapport om dette.

– Bestemor i Nord-Trøndelag er jo ikke vant til å snakke normert i det hele tatt, sier utvalgsmedlem Line Adde, product manager i Aidn.

Adde har doktorgrad i talegjenkjenning og jobber med digitale løsninger for helsevesenet.

Knut Kvale seniorforsker i Telenor

Knut Kvale, seniorforsker i Telenor

Foto: Telenor

– Norsk talegjenkjenning i dag virker best på østlandsdialekt og litt bedre på mannfolk enn på kvinner. Den virker veldig dårlig på barn, sier et annet utvalgsmelden, seniorforsker i Telenor Knut Kvale.

Folk med vestlandsdialekt sliter ofte med å bli forstått av kunstig intelligens, men Kvale vet også selv hvor vanskelig det kan være å bli forstått med Valdres-dialekt.

Det har med mengdetrening å gjøre, forklarer han.

– Hvis vi hadde hatt ubegrenset med taleopptak på Valdres-dialekt, så ville talegjenkjenneren vært mye bedre til å transkribere min dialekt.

Smarthøytalere

Markedet er fullt av stemmestyrte smarthøyttalere.

Foto: Tonje Grimstad / NRK

Viktige verktøy

Utvalgets medlemmer er også enige om at slike verktøy blir stadig viktigere.

– De som har funksjonsnedsetting åpenbart, dysleksi åpenbart, men også folk som har en jobb hvor man skriver mye. For man snakker faktisk 3–4 ganger fortere enn det man skriver, sier Adde.

Line Adde i Aidn

Line Adde, product manager i Aidn

Foto: Tonje Grimstad / NRK

I dag kan for eksempel leger diktere teksten inn i pasientjournaler. Det er særlig greit hvis hendene er opptatt med noe annet, sier Adde.

– På operasjonssalen for eksempel.

I fremtiden vil man kunne styre mye mer med stemmen, mener Adde.

– Støvsugere og ovner. Skru av varmen og lyset. Heve gardiner. Alle sånne ting blir jo stemmestyrt etter hvert. Smarthus da.

Robotstøvsuger

Flere robotstøvsugere kan styres med stemmen ved hjelp av Google Assistant.

Foto: Tonje Grimstad / NRK

Trenger mye data

Taleteknologi bygger på at maskinene lærer seg å kjenne igjen mønstre.

Språkbanken ved Nasjonalbiblioteket jobber med å samle inn lyd og utskrift av nordmenn med forskjellige dialekter, for å tilby dette til dem som utvikler taleteknologi.

Det kan være forskere både ved universiteter og i private selskaper.

Nasjonalbiblioteket

Nasjonalbiblioteket har sin egen satsing på taleteknologi, gjennom Språkbanken.

Foto: Tonje Grimstad / NRK

Men det å tilrettelegge lyd og utskrifter er dyrt, og det trengs store mengder. Det forteller språkteknolog Per Erik Solberg, som også satt i utvalget.

– Man trenger med barn. Man trenger med eldre. Vi kunne hatt bruk for mer hverdagstale. Noe vi for eksempel har mye av er tale fra Stortinget. Det er lett å få tak i, sier han.

Fordelen med taler fra Stortinget er at man vet alder og dialektopprinnelse på alle som snakker. I tillegg til at lyden ikke er rettighetsbelagt.

Ber myndighetene ta grep

Myndighetene må engasjere seg for at alle skal kunne kommunisere med taleteknologi, skriver ekspertutvalget i rapporten.

– Det synes jeg absolutt, sier Adde.

Per Erik Solberg ved Nasjonalbiblioteket

Per Erik Solberg, språkteknolog ved Språkbanken

Foto: Tonje Grimstad / NRK

– Ett av initiativene som er foreslått i den rapporten er jo noe som de har gjort i Finland. Som er å ha en app eller en nettløsning hvor folk kan ta opp fritt at de snakker og sende inn det til en database, sier Solberg.

Dette ville igjen kunne bli tilrettelagt for utviklere via Språkbanken.

Kultur- og likestillingsminister Anette Trettebergstuen er enig i at det er svært viktig at alle kan snakke til digitale hjelpemidler på sin egen dialekt.

– Ja, det er jo viktig å si at språkteknologi på norsk det kommer definitivt ikke av seg selv. Det må vi aktivt legge til rette for, som et relativt lite språkområde som Norge er, sier Trettebergstuen.

Kultur- og likestillingsminister Anette Trettebergstuen

Kultur- og likestillingsminister Anette Trettebergstuen

Foto: Ole Berg-Rusten / NTB

Hun er også opptatt av at folk som leser inn lyd skal kunne få det transkribert på både bokmål og nynorsk.

– Veldig mange i landet vårt har nynorsk som sitt første skriftspråk, og de skal ha samme muligheter som bokmålsbrukere til å kommunisere også digitalt.

Kulturministeren mener myndighetene allerede har gjort mye ved å etablere Språkbanken ved Nasjonalbiblioteket.

– Men vi er selvfølgelig opptatt av å vurdere alle forslag som kommer.

Google er opptatt av dette

Google har noen av de mest brukte digitale verktøyene.

Smarthøytalere fra Google

Digitale assistenter fra Google på utstilling i butikken.

Foto: Tonje Grimstad / NRK

Både talegjenkjenning på Google Home, transkriberingsverktøy og automatisk oversettelse av tekst.

Kommunikasjonssjef i Google Norge Sondre Ronander kjenner ikke til at deres verktøy har noen spesielle problemer med norske dialekter. Samtidig kan også han, som snakker østlandsk, oppleve å ikke bli forstått.

– Alle våre verktøy kan alltid bli bedre. Selvfølgelig. Det er også grunnen til at når du gir en kommando til assistenten så hender det at den spør: Var det dette du faktisk lurte på?

Sondre Ronander

Sondre Ronander, Kommunikasjonssjef i Google Norge

Foto: Mari Reisjå / NRK

Ronander sier noen språk, som engelsk, har veldig mye mer materiale for maskinene å trene på. Men han mener norske dialekter i prinsippet ikke er mer utfordrende for maskinene enn dialekter på andre språk.

– Det som er viktig er at folk skal kunne bruke sitt eget mål, også etter hvert som samfunnet blir stadig mer digitalisert, sier kommunikasjonssjefen.

– Det er noe man skal kunne forvente, og vi er ikke der ennå. På tvers av alt, men det er dit vi jobber mot å komme.

Bruker Norge Rundt

NRK bidrar til utvikling av taleteknologi gjennom et samarbeid med blant annet Språkbanken og NTNU.

Vi har tilgjengeliggjort 15.000 programmer, med vid dialektbredde sier Egil Ljøstad i NRK.

Egil Ljøstad

Egil Ljøstad, ansvarlig for radioteknologi i teknologiavdelingen i NRK

Foto: Tonje Grimstad / NRK

NRK kan bare dele programmer hvor man eier alt innhold. Så langt har man delt Norge Rundt og nyhetssendinger.

Man planlegger også å dele flere barneprogrammer, slik at maskinen skal få trent på barnestemmer.

NRK ønsker at folk med dårlig hørsel i fremtiden kan få et tilbud om utskrift av for eksempel podkaster,

Vi har over en million blant vårt publikum som har vanskeligheter med å høre, sier Ljøstad.

– Vi deler de nyeste programmene, så språket er slik vi snakker i dag.

Programleder Synnøve Sundby Fallmyr vil gjerne vise frem sitt barndoms alpinanlegg, men været er dårlig og det er lite snø. Kommer de seg i det hele tatt på ski?

Programleder Synnøve Sundby Fallmyr vil gjerne vise frem sitt barndoms alpinanlegg, men været er dårlig og det er lite snø. Kommer de seg i det hele tatt på ski?

AKTUELT NÅ