Kunstig intelligens på norsk grunn

– Jeg ble helt slått i bakken første gang jeg så hva ChatGPT fikk til, sa Farsethås, som er postdoktor ved Universitetet i Bergen og har lang erfaring innen både språk og teknologi.

 

Oppdagelsen tente en gnist. Farsethås kastet seg inn i arbeidet med språkmodeller og fikk etter hvert være med på innsiden av utviklingen av de norske modellene – et samarbeid mellom Nasjonalbiblioteket, NTNU og Universitetet i Oslo.

 

– Vi vet så lite om hva de store amerikanske og kinesiske modellene faktisk er trent på. Derfor er det viktig at vi bygger noe selv, som vi forstår, og som vi kan stole på.

MIMIR: En norsk modell med nordisk sjel

De norske språkmodellene har fått navn etter kunnskapens gud fra norrøn mytologi: MIMIR. Her er det samlet enorme mengder tekst fra norske og nordiske kilder – fra Wikipedia og romaner til offentlige dokumenter og politiske debatter.

 

– Vi snakker om 40 milliarder ord. 23 milliarder av dem på bokmål, men bare 557 millioner på nynorsk. Her trenger vi en dugnad, sa Farsethås, og oppfordret særlig nynorskkommuner til å bidra med tekstgrunnlag

Mer enn bare neste ord

Språkmodeller blir trent på å gjette det neste ordet i en tekst. Men Farsethås gjorde det klart at de lærer mye mer enn bare statistikk.

 

– Når en modell forstår at "det beste med filmen var popkornet" betyr at filmen var dårlig – da er det ikke bare sannsynlighet. Da er det ironi. Da har modellen begynt å skjønne noe.

 

Ved å bruke eksempler fra filmkritikk og andre områder illustrerte han hvordan språkmodeller utvikler forståelse, logikk og situasjonsinnsikt.

Kan språkmodeller lære klarspråk?

Språkmodeller som trenes på offentlige dokumenter og brosjyrer om klart språk, plukker opp både råd og eksempler.

 

– Det finnes en robot som heter Målfrid. Hun samler inn tekster fra regjeringen.no og statsforvaltningen. Det betyr at språkmodellen får med seg NOU-er, proposisjoner og rundskriv – og brosjyrer fra Språkrådet.

 

Men hvor gode er modellene til faktisk å skrive klart språk? Farsethås har selv testet ChatGPTs evne til å sette komma riktig – med imponerende 86 prosent treff.

 

– Det er litt som med oss mennesker. Vi gjør også kommafeil. Det interessante er at modellen bommet på akkurat de setningene som jeg selv bommet på, sa han med et smil.

Når vi skriver for å tenke

Farsethås pekte på at klart språk handler om mer enn å gjøre en tekst lett å lese. Det handler også om å klargjøre et saksforhold – for seg selv.

 

– Når vi skriver en saksframstilling, prøver vi å få oversikt over det viktigste i saken. Vi spør: Har vi fått med de rette fakta? Har vi brukt riktig regelverk?

 

Dette er en prosess der mennesker har en avgjørende rolle.

 

– ChatGPT vet ikke helt hva vi prøver å si. Den gjetter. Men vi vet. Det er derfor vi må skrive selv – og heller bruke modellen til å vurdere det vi har skrevet.

En felles oppgave for norsk forvaltning

Mot slutten av foredraget kom en tydelig oppfordring:

 

– Vi må samarbeide om å bygge gode, norske språkmodeller. Vi må evaluere bruken og dele resultatene. Da kan vi få til noe virkelig nyttig – og kanskje til og med ha det litt gøy med det.

 

Med det rundet Farsethås av en inspirerende reise i språk, teknologi og samfunnsansvar, og etterlot et engasjert publikum med nye tanker om hva klarspråk kan være i en digital framtid.


 

Om konferansen

Klarspråk 2025 - i ein digital kvardag, 3.-4. april, Bergen.

 

Hans Christian Farsethås, postdoktor ved Universitetet i Bergen, holdt foredraget: Norske språkmodellar og klart språk.

Metode for utarbeidelse av artikkel

  • Lydfil transkribert med NB-Whisper
  • Råtekst bearbeidet med ChatGPT
  • Endelig tekst utarbeidet av Torbjørn Vinje, daglig leder, Forum for offentlig service