Kronik: Taler du Danish, ChatGPT?

ChatGPT forstår hverken den danske alkohol- eller barselskultur, for den er ikke trænet på tilstrækkelige mængder danske data. Derfor må vi udvikle vores egen danske sprogmodel.

Uddrag af kronik i Weekendavisen

af Kristoffer Laigaard Nielbo, Center for Humanities Computing, AU og Katrine Frøkjær Baunvig, Center for Grundtvigforskning, AU


ChatGPT forstår hverken den danske alkohol- eller barselskultur, for den er ikke trænet på tilstrækkelige mængder danske data. Derfor må vi udvikle vores egen danske sprogmodel.

2023 bliver året, hvor kunstig intelligens, AI, og mere specifikt AI-baseret sprogteknologi for alvor gør deres indtog i vores offentlige bevidsthed. Det er en fantastisk teknologi, som allerede nu er med til at gøre livet rigere, dybere og mere nuanceret for mange mennesker. Det erfarer vi for tiden på egen krop, hvor AI-oversættelsesværktøjer sørger for, at vi får langt større udbytte af vores forskningsophold i Japan, end vi ville få uden.

Men for mange aflejrer den teknologiske udvikling sig først og fremmest i rynkede bryn. De mest betydningsfulde bekymringspunkter handler om de udfordringer, som ChatGPT giver i uddannelsessektoren, for arbejdslivet og sågar for rammerne om vores (med)menneskelighed. Der florerer højspændte og mere eller mindre fantastiske sci-fi-dystopiske bekymringer om udsigten til et omsiggribende overvågningssamfund.

Men der er også en mere sober og rodfæstet skepsis i omløb. Den angår såkaldte biasproblemstillinger – det vil sige tendenser til misrepræsentation af samfundsgrupper og mindretal – som (indtil videre) er et uomgængeligt problem ved store sprogmodeller. Uomgængeligt, fordi modellerne er »trænet« på store datasæt, hvori misrepræsentationen gemmer sig.

Læs hele kronikken i Weekendavisen (bag betalingsmur)