Du er med på å digitalisere bøker

– Når millionar av menneske skriv inn desse orda kvar einaste dag over heile internett, så får ein digitalisert veldig mange ord og dermed veldig mange bøker, utan å betale noko som helst for det og utan at dei som gjer det nødvendigvis veit om det, seier universitetslektor ved Institutt for informatikk ved Universitetet i Oslo, Gisle Hannemyr.

Når du til dømes skal opprette ein e-postkonto får du ein kode som du må tyde for å bevise at du er eit menneske og ikkje ein datamaskin ute etter å gjere ugang.

Kodane heiter CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart), og skal hindre datamaskiner i å sende søppelpost.

Varianten der du får to forvrengte ord å tyde heiter «reCAPTCHA».

Det er dette programmet Google bruker til å tyde skrifta i gamle bøker.

Slik fungerer det

– CAPTCHA går ut på at folk løyser oppgåver som menneske er flinke til, men datamaskiner enno ikkje meistrar. Ei av dei oppgåvene er tekstgjenkjenning, seier Hannemyr.

Google skannar ei stor mengd bøker for å gjere dei tilgjengelege gjennom «Google Bøker». Eit dataprogram tyder bileta av sidene og gjer dei om til tekst.

Men i gamle bøker er bokstavane ofte så utydelege at programmet ikkje klarer å tyde dei. Det er her du kjem inn.

– Det finst datamaskiner som kjenner igjen skrift, OCR («Optical Character Recognition»), men særleg i gamle bøker der blysatsen kanskje har vore litt slite, kjem desse programma til kort. Då må ein nytte menneskeleg arbeidskraft, seier Hannemyr.

(Saka held fram under biletet)

Korleis veit programmet at det du svarar er rett?

– Det veit svaret på det eine ordet. Skriv du dét riktig, går det ut frå at du også har svara riktig på det ukjende ordet, seier Hannemyr.

Fleire internettbrukarar får det same ordet og når mange nok har svara det same, set programmet det inn i teksten. Og du har vore med på å digitalisere ei bok.

75 mil lang bokhylle

Til no har Google digitalisert over 15 millionar bøker på kring 400 forskjellige språk.

Harald Jacob B. Skaarn er produktansvarlig hos Google.
Foto: Privat

– Viss kvar bok er 5 cm tjukk vil det motsvare ei 75 mil lang bokhylle, seier Harald Jacob B. Skaarn i Google.

Det er ein sjanse for at nettopp du har medverka til dette.

– Eg har ikkje tal på kor mange av bøkene me har brukt «reCAPTCHA» på, det avheng av kvaliteten på teksten, men det er veldig mange, særleig dei eldre bøkene, seier Skaarn.

LES OGSÅ: Slik låner du en e-bok

Gratis arbeidskraft

– Det er ei snedig utnytting av at veldig mange menneske bruker internett dagleg. Ein utnyttar mikroarbeidskrafta ved kvar einaste ordgjenkjenning, seier Hannemyr.

Han ser ingen problem med denne måten å digitalisere bøker på, fordi det er eit biprodukt av ei nyttig teneste, som skal stoppe spam og søppelkommentarar på internett.

– Nokon vil kanskje seie at her utnyttar ein millionar av internettbrukarar sin arbeidskraft gratis, men eg klarar ikkje å hisse meg opp over det. Om ein tek vare på ordet som mennesket kjenner igjen eller ikkje, så er arbeidet ein gjer det same, seier han.

Google kunne ikkje vore forutan den jobben internettbrukarane gjer.

– Men me samlar ikkje inn informasjon om nokon eller brukar det på noko annan måte, seier Skaarn.

LES OGSÅ: Gode tall for Google og Microsoft

Mange veit ikkje

Trass i at «reCAPTCHA» er ein global dugnad som hjelper Google til å digitalisere bøker, veit dei færraste om at dei er med på det.

– Google gjer ingen hemmelegheit ut av det, men ein må klikke på ei lenkje for å komme til sida der heile prosessen blir forklart, seier Hannemyr.

I vindauget som kjem opp, står det med lita skrift: «Stopp spam, les bøker».

Kvifor ikkje fleire veit kva dei er med på, har ikkje Skaarn i Google noko godt svar på.

– Det handlar kanskje om interesse. Det er eit teknisk produkt og mange ting går folk hus forbi. Eg trur mange kjenner igjen reCaptcha når dei ser det, seier han.

Viktig for Google

Det var forskarar ved Carnegie Mellon Universitetet i USA, som fekk den lyse ideen å kombinere menneskeleg teksttyding med sikkerheitsverktøy for internett. I 2009 vart selskapet kjøpt av Google.

For å vise omfanget av digitaliseringa, trekk Skaarn fram ei gamal norsk bok, som sannsynlegvis er digitalisert med hjelp av internettbrukarar, «Norske Huldreeventyr og folkesagn volum 2», trykt i 1848.

– Gammal informasjon er like spanande som ny informasjon. Å finne ut kva som står i gamle bøker er veldig viktig for Google, når me skal gjere all informasjon tilgjengeleg, seier Skaarn.

«Crowdsourcing»

«Crowdsourcing» er eit ordspel på ordet «outsourcing», som tyder å sette ut ei oppgåve til nokon andre. Her blir oppgåva sett ut til veldig mange.

– «Crowdsourcing» er eit fenomen som har oppstått på internett fordi det er så lett å dele eit prosjekt på veldig mange folk. Wikipedia er eit døme på det, seier Hannemyr.

LES OGSÅ: Wikipedia stenger sjappa på onsdag - slik kan du omgå blokaden

Medan nettleksikonet Wikipedia er avhengig av at folk skriv artiklar for dei, er reCaptcha avhengig av at internettbrukarar løyser slike kodar.

– Det som er litt spesielt her er at ein tek i bruk «crowdsourcing» utan at dei som deltek i prosjektet blir fortalt at dei er med på det. Det er ikkje noko hemmeleg, men ein må oppsøkje informasjonen, avsluttar Hannemyr.

LES OGSÅ:

Nye funn om grønnsaker: – Vi ville klart å dyrke veldig, veldig mye mer

Mottok bestilling på 18.000 glass vann: – Du bør ikke bruke KI til alt

7. oktober 2025 kl. 00:16
Musikk

Progrockbandet «Rush» gjør comeback med kvinne bak trommene

Progrockbandet «Rush» gjør comeback etter over ti år med pause. Mandag varslet bandet at de skal ut på turné i USA, Canada og Mexico i 2026.

Det blir første gang Geddy Lee og Alex Lifeson opptrer sammen etter at trommeslager Neil Peart gikk bort i 2020, skriverThe guardian.

Lee og Lifeson har ansatt tyske Anika Nilles (42) som ny trommeslager i bandet. Hun ble oppdaget av «Rush» da hun spilte med Jeff Beck på hans siste Europa-turné i 2022.

De beskriver den kommende turnéen som en feiring av over 50 år med Rush-musikk.

Foto: AP
6. oktober 2025 kl. 17:09
Taylor Swift

Taylor Swifts «reklamefilm» for det nye albumet inn på kinotoppen i USA

To uker før utgivelsen av Taylor Swifts nye album, «The Life of a Show Girl», ble det offentliggjort at albumet ville få følge av en 89 minutter lang kinofilm med musikkvideoer, bak scenen-filmer og låttekster.

På tre dager – 3. til 5. oktober – som filmen «The Official Release Party of a Show Girl» var å se på 3702 amerikanske kinoer, spilte den inn 33 millioner dollar, ifølge Deadline. Det tilsvarer nærmere 330 millioner norske kroner.

(NTB)

Foto: Jordan Strauss / AP
6. oktober 2025 kl. 09:59
Dataspill

– Ikke revolusjonerende, men sjarmerende

«Story og Seasons: Grand Bazaar» er et koselig gårdsspill som krever både tid og tålmodighet, mener vår spillkritiker Tonje Gundersen Gilje.

Terningkast 4 Spill

«Dette kan bli en skikkelig tidssluker»

Anmeldelse: «Story of Seasons: Grand Bazaar»
Av Tonje Gundersen Gilje

Du digitaliserer bøker for Google

Slik fungerer det

75 mil lang bokhylle

Gratis arbeidskraft

Mange veit ikkje

Viktig for Google

«Crowdsourcing»

NRK anbefaler

Nye funn om grønnsaker: – Vi ville klart å dyrke veldig, veldig mye mer

Mottok bestilling på 18.000 glass vann: – Du bør ikke bruke KI til alt

Kulturstrøm

Progrockbandet «Rush» gjør comeback med kvinne bak trommene

Taylor Swifts «reklamefilm» for det nye albumet inn på kinotoppen i USA

– Ikke revolusjonerende, men sjarmerende

«Dette kan bli en skikkelig tidssluker»

Anbefalinger

Ti serier vi gleder oss til i høst

«Kan bli en magisk opplevelse»

Topp fem bøker som trendar på Booktok

NRK

Kontakt

Hjelp

Tjenester

Produksjon

Salg

Slik fungerer det

75 mil lang bokhylle

Gratis arbeidskraft

Mange veit ikkje

Viktig for Google

«Crowdsourcing»

NRK anbefaler

Nye funn om grønnsaker: – Vi ville klart å dyrke veldig, veldig mye mer

Mottok bestilling på 18.000 glass vann: – Du bør ikke bruke KI til alt

Progrockbandet «Rush» gjør comeback med kvinne bak trommene

Taylor Swifts «reklamefilm» for det nye albumet inn på kinotoppen i USA

– Ikke revolusjonerende, men sjarmerende

«Dette kan bli en skikkelig tidssluker»

Anbefalinger

Ti serier vi gleder oss til i høst

«Kan bli en magisk opplevelse»

Topp fem bøker som trendar på Booktok

NRK

Vi arbeider etterVær Varsom-plakatens reglerfor god presseskikk.

Kontakt

Hjelp

Tjenester

Produksjon

Salg

Vi arbeider etter
Vær Varsom-plakatens regler
for god presseskikk.