DanskGPT
| Udvikler(e) | Mads Henrichsen (under syv.ai) |
|---|---|
| Udgivet | December 2022 (projektets start) |
| Platform | Fin‑tuning af LLaMA (transformer) med en “chat‑version” og basis‑version |
| Licens | Tiny‑version: Apache‑2.0 (open source). Større version: kommerciel/privat (ikke klart angivet) |
| Hjemmeside | danskgpt.dk (virker ikke: www.danskgpt.dk) |
DanskGPT (er en forkortelse for Dansk Generativ Præ-Trænet Transformer) er en danskudviklet chatbotsom anvender generativ kunstig intelligens, designet til at forstå og generere dansk tekst med særlig hensyntagen til sproglige nuancer, dansk kultur og datasikkerhed.[1] Der er ikke fri adgang til DanskGPT.
Projektet er startet som et fritidsinitiativ af data scientist Mads Henrichsen og har ambitiøse mål om at blive et dansk alternativ til globale modeller som ChatGPT.[2] DanskGPT er bygget på en open source sprogmodel, som Meta har lavet.[3] DanskGPT tæller i alt tre milliarder danske ord og vendinger.[4]
Historie og udvikling
Oprindelse og motivation
Mads Henrichsen,[5] data scientist (dansk dataforsker) hos PFA Pension, begyndte arbejdet med DanskGPT i december 2022 som et hobbyprojekt.[6] Han har anslået at have investeret omkring 950 til 1.000 arbejdstimer[7] og cirka 102.000 kr. i projektet.[8][9][10] Projektets formål er at sikre, at dansk sprogteknologi ikke sakker bagud, og at sprogmodellerne fremstår mere naturlige og kulturelt tilpassede end internationale modeller.[11]
Presseomtale
I november 2023 blev DanskGPT omtalt i Kommunikation & Sprog, hvor Henrichsen fremhævede, at modellers ensformige og engelskinfunderede sprog kan gøre dansk kommunikation kunstig over tid.[9]
Teknologi og arkitektur
| Emne | Kommentar |
|---|---|
| type | Stor sprogmodel / generativ transformer‑model |
| organisation | syv.ai (privat projekt) |
| træningsdata | Ca. 3 milliarder danske ord, bredt indsamlet (nyheder, bøger, offentlige dokumenter, online tekster) |
| modelstørrelse | Flere milliarder parametre; inkluderer også en “DanskGPT‑tiny” med ca. 1,1 milliarder parametre under Apache‑2.0 |
| trin i udvikling | Fin‑tuning (self‑instruct/iterativ), inkl. syntetiske data og instruktioner genereret af modellen selv |
| licens | Tiny‑version: Apache‑2.0 (open source). Større version: kommerciel/privat (ikke klart angivet) |
| særlige kendetegn | Dansk‑specifik sprogtone, GDPR‑venligt, kan køres on‑premise uden datalækage, mulighed for indbygget Google‑søgefunktion |
| formål | At skabe et dansk alternativ til ChatGPT; bevare danske sproglige finurligheder og kultur, øge datasikkerhed og suverænitet |
| brug | Offentlige institutioner, virksomheder (f.eks. HR), undervisning, borger‑chatbots |
| estimat om omkostninger | Ca. 100 000 kr og omkring 950–1 000 timers arbejde lagt i træningen |
| fremtidsplaner | Arbejde mod større og bedre model, forbedret viden om Danmark og dansk kommunikation, blive konkurrencedygtig med ChatGPT |
| podcast | Medvirker i “EDB 5.0”-afsnit #77 om DanskGPT |
Modelarkitektur
DanskGPT er baseret på transformerarkitektur og bygger videre på open source-grundmodeller som LLaMA. Modellen findes i flere udgaver, herunder en basisversion til tekstgenerering og en chatversion til dialogform.[11]
Træningsdata og teknikker
Modellen er trænet udelukkende på dansk tekst – ca. 3 milliarder ord fra nyheder, litteratur, offentlige dokumenter og onlinekilder – samt syntetiske data via self-instruct-teknikker, der forbedrer modellens evne til at følge instruktioner.[11][9]
Licens og open source
En mindre tiny-variant af DanskGPT er frigivet under Apache 2.0-licens og er tilgængelig på Hugging Face.[12] Det sikrer åbenhed og mulighed for tilpasning.[11]
Softwarearkitektur og deployment
DanskGPT kan installeres både lokalt og i skyen. Brugere kan vælge at køre modellen via en API eller som Docker-container. Der findes også en chatversion (v2.0/v2.1), og tjenesten drives med sponsorstøtte fra Syv.ai.[13]
Etik, privatliv og GDPR
Datasikkerhed og suverænitet
Modellen er designet til at beskytte brugernes data: den kan køre lokalt uden at sende information til eksterne cloudtjenester. Brugerdata gemmes og logges ikke.[11][8]
Etisk gennemsigtighed
Udvikleren oplyser åbent om modellens begrænsninger, herunder risiko for hallucinationer. Brugere opfordres til kritisk tænkning og forsigtighed i anvendelsen.[11]
Sammenligning med globale modeller
- Trænet udelukkende på dansk tekstmateriale, hvilket giver bedre forståelse for danske idiomer og kontekst.
- Modellen kan køre lokalt og overholder GDPR.
- DanskGPT tilbyder en open source-version, som kan tilpasses frit.
- Sammenlignet med ChatGPT, Gemini og Claude, har DanskGPT mindre global viden, men stærkere dansk kulturforståelse.[11][9]
Anvendelsesområder
Offentlig sektor
Anvendes til chatbots i borgerservice, dokumentresumé og kommunikation – med fokus på databeskyttelse og lokal drift.[11]
Virksomheder
Bruges til kundesupport, tekstgenerering og interne værktøjer, hvor data må forblive fortrolige.[11]
Uddannelse og borgere
Mulighed for AI-læringsassistance, sproglig støtte og adgang til dansksproget teknologi uden at data forlader brugerens system.[11]
Kritik og begrænsninger
- Begrænset mængde træningsdata i forhold til globale modeller medfører større risiko for upræcise eller hallucinerede svar.[9]
- Modellen er udviklet uden støtte fra virksomheder eller fonde, hvilket begrænser opdateringshastigheden.[9]
- Kræver regelmæssig vedligeholdelse for at følge med i sprogudvikling og viden.
Referencer
- ^ https://www.sylvester-co.dk/danskgpt-den-danske-udgave-af-chatgpt/
- ^ https://www.cybersundhed.dk/alle/derfor-har-vi-brug-for-en-danskgpt/
- ^ https://nors.ku.dk/english/research-files/sprogteknologisk-konference-2024/DanskGPT.pdf
- ^ Har du prøvet ChatGPT’s danske alternativ - DanskGPT? (dateret d. 28. november 2023) på computerworld.dk
- ^ Derfor har vi brug for en DanskGPT (dateret d. 15/07/2024) på cybersundhed.dk
- ^ https://www.computerworld.dk/art/285232/har-du-proevet-chatgpts-danske-alternativ-danskgpt
- ^ https://prosabladet.dk/nyheder/nyhed/mads-har-brugt-900-timer-paa-at-udvikle-danskgpt-det-er-gaaet-ret-meget-amok
- ^ a b https://danskgpt.dk/
- ^ a b c d e f https://kommunikationogsprog.dk/nyheder/dansker-vil-skabe-konkurrent-til-chatgpt
- ^ https://www.ai-portalen.dk/danskgpt-et-vanvids-projekt-for-en-enkelt-mand/
- ^ a b c d e f g h i j https://syv.ai/produkter/danskgpt
- ^ https://sprogteknologi.dk/dataset/danskgpt-tiny/resource/0f453a48-6a2a-4760-8e8c-63c0076be634
- ^ "Arkiveret kopi". Arkiveret fra originalen 22. april 2025. Hentet 14. august 2025.
Eksterne links
- Officiel hjemmeside
- DanskGPT chatportal Arkiveret 22. april 2025 hos Wayback Machine
- Produktbeskrivelse hos Syv.ai
| Spire Denne artikel om software og programmering er en spire som bør udbygges. Du er velkommen til at hjælpe Wikipedia ved at udvide den. |
Content Disclaimer
Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.
- The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
- There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
- It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
- Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
- Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.