Hopp til innhold

Stemmetjenester tar av på nett: – Vi er i ferd med å miste kontrollen

Dagene hvor vi kunne stole på lyd kan være talte.

Dalton Bantz har laget populære klipp med fire presidenter som spiller Uno takket være AI-stemmetjeneste.

POPULÆRT INNHOLD: Flere av de mest populære videoene om dagen bruker syntetiske stemmer av USA-presidentene i uformelle spillsammenhenger. Fra Fortnite, Minecraft til kortspillet Uno.

Foto: Youtube / Dalton Bantz

En ny trend med lydtjenester basert på kunstig intelligens (KI) gir folk muligheten til å kopiere stemmer og konstruere fiktive samtaler. Kvaliteten er nå så god at det er lett å la seg lure.

Bare uker etter at selskapet Eleven Labs lanserte en nettside med KI-verktøy for lyd, har det flommet over av populære humorvideoer på TikTok, YouTube og Twitter.

Blant populære klipp kan man høre podkast-personlighet Joe Rogan snakke om å bli styrt av en mus som i Disney-filmen «Ratatouille». Mens det nesten daglig dukker opp klipp som fremstiller USA-presidenter som umodne spillkompiser.

Ta en titt her:

Ved siden av humorklipp kommer også eksemplene med misbruk og deling av støtende innhold.

– Brukere begynte tidlig å dele lydklipp med Hillary Clinton som leser transfobiske tekster, Bill Gates som sier covid-19-vaksinen gir AIDS, og det som tilsynelatende skal være Emma Watson som leser Hitlers «Mein Kampf», skriver nyhetsbyrået AP.

Hvordan fungerer kunstig intelligens i lyd?

Algoritmer trenes opp til å ta ulike stemmer og assosiere hvilke ord som gir hvilke bestemte lyder. På denne måten vil taletjenester høres veldig menneskelige ut, og de kan justeres til å høres ut som en konkret person.

Noen av de mest populære tjenestene for publikum i dag er Eleven Labs, Uberduck.ai og Voice.ai.

Mannen bak flere virale klipp uttaler at klippene er morsomme fordi de åpenbart er falske.

– Nå vet vi aldri hva Biden kan finne på å si. Det kan være gøyalt, vulgært eller usammenhengende sprøyt. Han ikke lenger treg og kjedelig, sier innholdsskaper Zach Silberberg, ifølge Yahoo.com.

Zach Silberberg leker med Ratatoullie og podkastpersonlighet Joe Rogan.

– Som i Ville vesten

Professor i kunstig intelligens Morten Goodwin ved Universitet i Agder har hatt tilgang til teknologien disse nye tjenestene bruker i lang tid. Han mener sannhet begynner å bli vanskelig å forholde seg til.

– Vi er i ferd med å miste litt kontrollen.

I dag har de fleste av oss lært å ta ting vi leser om på internett med en klype salt. Ting som virker for godt til å være sant, er ofte ikke sant. Nå er det samme i ferd med å skje med lyd og bilde, mener forskeren.

– Før så vi på lydopptak som god dokumentasjon, men plutselig er det ikke det lenger.

Teknologiens bakside har fått mye oppmerksomhet etter at «Deep Fake»-fenomenet dukket opp for fem år siden. Siden den gang har KI-sektoren eksplodert:

Nå diskuteres det ukentlig hvordan kunstig intelligens påvirker hverdagen vår.

KI-bruk innen tekst, bilder, video og lyd har gitt et hav av nye muligheter. Fra å lage digital kunst, skrive skolestiler og bøker, til å bevare stemmer til pensjonerte skuespillere. Og hva er musikkindustriens syn på det KI klarer å gjøre med kjente musikere?

Den store hodepinen er at ingen vet hvor grensene skal gå for eierskap, og hva som skal være lov å gjøre, forteller Goodwin.

– Det er fullt mulig å lage musikk inspirert av Elvis, men hvis det lages av en algoritme og ikke er direkte kopiering, hvem eier da rettighetene?

– Nå er det litt som i Ville vesten. Det minner om da internett først dukket opp og musikk, filmer og lyd ble delt uten kontroll. Slik er det med kunstig intelligens i dag.

KI-forsker Morten Goodwin ved Universitet i Agder.

KI-forsker Morten Goodwin ved Universitet i Agder. Han er også nestleder ved Centre for Artificial Intelligence Research.

Foto: Pål Tegnander / NRK

Kan brukes til cyberkrig

EU har et lovforslag ute på høring om retningslinjer for god bruk av kunstig intelligens, men ingen vet når en ny lov vil tre i kraft, og heller ikke hva den sier om lyd.

I mellomtiden er det litt fritt fram for alle, mener Goodwin.

– Jeg tenker at det er greit med humor og parodi til en viss grad, men et sted må grensen gå for hva man kan gjøre uten folks tillatelse.

Grunnen til at KI-forskeren mener det haster å stramme inn reglene, er at syntetiske stemmer vil bli utnyttet av flere enn bare nettroll og telefonsvindlere.

– Denne teknologien vil også kunne brukes av nasjoner til cyberkrigføring. Se for deg at noen kopierer stemmen til sjefen i Equinor og ringer til nestlederen med beskjed om å stenge av en oljeplattform. Dette er mulig å gjøre nå.

Frem til det blir strengere lover rundt bruken av KI-lyd, kan det være lurt å være mer kritisk til hva man hører fremover:

Mer om regjeringen og EUs forslag til lovverk for kunstig intelligens kan du lese her.

Er denne lydteknologien skummel?

Ja 86%

Nei 14%

Avstemningen er lukket. 9276 stemmer totalt

Les flere saker om kunstig intelligens:

Kulturstrøm