Podcast: Udvikling af en stor dansk sprogmodel
Lyt med på AI Denmark's podcast når professor Kristoffer Nielbo fortæller om Center for Humanities’ arbejde med at udvikle en stor dansk sprogmodel.
Lyt med på AI Denmark's podcast når professor Kristoffer Nielbo fortæller om Center for Humanities’ arbejde med at udvikle en stor dansk sprogmodel (Danish Foundation Models), og hvorfor de flersprogede modeller, som vi kender fra ChatGPT, kommer til kort på dansk særligt grundet kulturelle forskelle, der forankres i modellens sprogbrug.
Kristoffer Nielbo fortæller hvorfor de ensprogede modeller er bedre rent teknisk og klarer sig bedre end de flersprogede, og så er der også hele spørgsmålet om, hvad man kan og bør bruge flersprogede modeller til, som er baseret på materialer fra eksempelvis Kina og USA.
Sprogmodellerne vil nemlig i stigende grad blive integreret i alle mulige services, hvor vi ikke længere er opmærksomme på, hvad der ligger bag, og disse services vil formegentlig også blive anvendt til at understøtte beslutningstagning ude virkeligheden, hvor brugerne er virksomheder, myndigheder og nyhedsproducenter. Manglende transparens og dermed viden om, hvilke materialer disse privatejede flersprogede modeller er trænet på er dermed problematisk.
Udvikling af en ikke-privatejet, stor dansk sprogmodel er derfor en nødvendighed - og vi er godt på vej. Vi har nemlig allerede skaffet os adgang til så store mængder sprogdata, at vi kan matche de amerikanske modeller, og vi har adgang til regneressourcerne via de nationale og europæiske supercomputere.
I Center for Humanities Computing har vi dermed allerede alle ingredienserne til at udvikle en stor dansk (og på sigt generativ) sprogmodel inklusiv ekspertisen til at gøre det, så næste skridt er at sikre langsigtet funding til projektet, som er nødvendig, da der kommer mere og mere opmærksomhed på sprogmodeller generelt og deraf også nødvendigheden af en stor dansk sprogmodel jf. de udfordringer, som podcasten belyser.
Læs mere om den store danske sprogmodel Danish Foundation Models