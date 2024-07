Ett av de nylig inkluderte språkene er nordsamisk.

– Jeg synes det er enestående og spennende. Her skjer utviklingen så fort at jeg tror vi vil se veldig gode resultater på de små språkene, sier teknologientusiast og tidligere sametingsdirektør Rune Fjellheim.

«Shit in, shit out»

Det samiske språkteknologiske miljøet ved Universitetet i Tromsø (UiT) ser derimot ikke like lyst på Googles nye tilskudd.

Googles språkverktøy er lagd med kunstig intelligens (KI).

For å lage en slik «oversettelsesmaskin», trengs det mye data, og tradisjonelt sett har man trengt en enorm mengde parallelltekster.

Tekniske gjennombrudd har gjort at det trengs mindre data enn før for å nå opp til Googles kvalitetsstandard når det gjelder maskinoversettelser.

Inga Lill Sigga Mikkelsen forteller at det samiske språkmiljøet ved UiT bevisst har unngått å lage maskinoversettere til samisk. Foto: Vetle Knutsen / NRK

Inga Lill Sigga Mikkelsen, språkforsker og overingeniør i Divvun, mener likevel at maskinoversettelsen er for dårlig.

Hun frykter at KI vil produsere nordsamiske tekster med dårlig språk, og at folk kommer til å publisere det på nett.

De er bekymret for at disse «dårlige» tekstene igjen vil bli brukt til å trene opp de samiske maskinoversetterne, og at det kan «forurense» dataen.

– Hvis du mater dårlig språk inn i KI, så blir det «shit in, shit out», sier Mikkelsen.

Nettopp derfor har det samiske språkteknologiske miljøet ved UiT bevisst unngått å lage programmer som oversetter til samisk.

– En gladnyhet for små språk

Sondre Ronander, kommunikasjonssjef i Google Norge og Finland, er uenig med språkmiljøet ved UiT i at man ikke har nok data til å lage gode oversettelsesprogrammer.

– Det er jo nettopp på grunn av den alternative fremgangsmåten vi har brukt her som gjør at vi ikke trenger like store mengder parallelltekster som tidligere metoder har hatt behov for, sier han.

Kommunikasjonssjef i Google mener det nye tillegget er en gladnyhet. Foto: Mari Reisjå / NRK

Ronander forteller at Google har tatt hensyn til språkets sårbarhet, og påpeker at de har høye kvalitetskrav før de lanserer oversettere på nye språk og at folk med nordsamisk språkkompetanse har vært involvert.

– Jeg synes dette er en supernyhet, en gladnyhet for små språk. Jeg håper det kan bidra til å unngå at språkarven forsvinner for mange flere språk, sier han.

Likevel poengterer han at oversettelsesprogrammer aldri vil være 100 prosent korrekt.

– Jeg tror aldri man skal stole 100 prosent på noen datasystemer. Vi må alltid ha kildekritikk, også inni det digitale livet, sier Ronander.

Hva synes du om Google Oversetter på nordsamisk? Den er kjempebra! Jeg liker den ikke. Vet ikke. Vis resultat

Tror det er feil å kreve det perfekte

Rune Fjellheim er ikke redd for at maskinoversettere vil skade språket.

– Jeg tenker at det viktigste er at vi i mellommenneskelige relasjoner vedlikeholder språket på et aktivt vis. Og så blir det her et slags hjelpemiddel, sier han.

I tillegg tror han at teknologien er vanskelig å stoppe, og at den bør omfavnes, istedenfor at man frykter den.

– Jeg vil bare oppfordre folk til å bruke de her verktøyene.

– Og kanskje bistå med å korrigere de oversettelsene som man ser er åpenbart feil. For det hjelper jo neste bruker, legger han til.

Rune Fjellheim er tidligere direktør i Sametinget, og kaller seg selv en superbruker av KI og teknologi, særlig innenfor samisk anvendelse. Foto: Nelly Anna Karolina Engström / NRK

Han mener at man ikke kan vente med å ta i bruk språkverktøy til de blir perfekte.

– Her tenker jeg at man gjør en stor feil om man krever det perfekte før man kommer i gang, sier Fjellheim.

Han sammenligner det med å lære et nytt språk.

– Du snakker jo et nytt språk litt dårlig, før du blir flinkere. Dette systemet blir bare bedre og bedre. Særlig hvis vi kan bidra litt av og til ved å korrigere en feiloversettelse, sier Fjellheim.

Sterk oppfordring

Inga Lill Sigga Mikkelsen har en sterk oppfordring om å bruke KI-oversettelser med varsomhet.

– Ikke oversett til samisk med Google Translate og publiser det uten at det er kvalitetssikret. Det blir kjempeskummelt.

– Det er det som blir fremtidenes treningsdata for KI. Vi vil ha bra KI-treningsdata, sier hun.

Dersom folk følger dette, mener hun at oversetteren kan være positiv.

– Jeg tror det er positivt for det samiske samfunnet, men også det norske og folk i verden, hvis man ikke bruker det til å forurense det som publiseres.

– Men vi vet jo ikke hvordan folk vil bruke Google Oversetter. Tiden vil vise om det er går bra eller ikke.