Når AI altid siger 7: Groupthink-problemet med store sprogmodeller og hvad det betyder for virksomheder


Eksperimentet, der skaber ubehag
Den, der har lidt tid til overs, kan udføre en simpel test: Åbn din foretrukne KI-chatbot – hvad enten det er ChatGPT, Claude eller Gemini – og skriv: „Giv mig et tilfældigt tal mellem 1 og 10." Svaret vil med stor sandsynlighed være: 7. Gentager man forespørgslen, følger der som regel et 3 eller 4, derefter et 8 eller 9. Det, der ligner et tryllekunstnernummer, er i virkeligheden et symptom på et dybtliggende strukturelt problem ved moderne Large Language Models (LLMs): De er langt mere forudsigelige, langt mere konformistiske og langt mindre kreative, end deres brugere almindeligvis antager.
Dette fænomen er hverken tilfældigt eller en fejl – det er en direkte konsekvens af den måde, disse modeller trænes på. Og det har vidtrækkende konsekvenser for virksomheder, der anvender KI ikke blot til strukturerede, klart definerede opgaver, men også til idéudvikling, strategisk brainstorming og kreative processer.
Homogenitet som systemisk træk
Forskere har undersøgt fænomenet under den rammende betegnelse „Artificial Hivemind" og har i den forbindelse påvist en bemærkelsesværdig ensartethed – ikke blot inden for de enkelte modeller, men også på tværs af forskellige systemer fra forskellige producenter. Da 25 forskellige LLMs hver blev bedt 50 gange om at formulere en metafor for tid, lød størstedelen af de i alt 1.250 svar: „Tid er en flod" eller „Tid er en væver". Arbejdet blev tildelt Best-Paper-Award ved NeurIPS – en af verdens mest anerkendte KI-konferencer.
Årsagen ligger i den strukturelle lighed mellem træningsprocesserne: De fleste førende LLMs trænes på lignende datasæt, med lignende metoder og til lignende anvendelsesformål. Resultatet er en slags kollektiv regression mod midten – modellerne foretrækker statistisk hyppige, såkaldte „samfundsmæssigt sanktionerede" svar og undgår afvigere. De er med andre ord optimeret til konsensus, ikke til originalitet.
„Den måde, de fleste chat-interfaces er udformet på, giver fornemmelsen af en personlig samtale. De fleste mennesker er ikke rigtigt klar over, i hvilken udstrækning de får det samme som alle andre."
For klart afgrænsede, gentagne opgaver – databaseforespørgsler, kodegenerering, dokumentopsummering – er denne egenskab ganske nyttig. Men så snart virksomheder integrerer KI i udforskende eller strategiske sammenhænge, støder modellen på en fundamental begrænsning.
Temperatur-misforståelsen og hvorfor simple parameterjusteringer ikke er nok
Det ligger lige for at formode, at problemet kan løses via tekniske indstillinger. LLMs råder over en parameter kaldet „Temperature", der styrer tilfældigheden i outputtet. Højere temperatur, mere varians – sådan lyder den forenklede logik. I praksis viser det sig imidlertid, at en generel opskruning af denne knap hurtigt fører til inkohærens: Modellerne begynder at skifte sprog midt i teksten eller producerer semantisk usammenhængende tekstblokke.
Det australske startup Springboards har valgt en anden tilgang: Deres model "Flint", bygget på open source-modellen Qwen 3 fra Alibaba, er trænet til præcist at identificere de steder i et svar, hvor mere varians er meningsfuld og mulig – og kun der øge tilfældigheden. Når nogen spørger "Hvor skal jeg rejse hen i Europa?", behøver modellen kun tilfældighed på det punkt, hvor den nævner rejsemålet – ikke ved hvert enkelt ord i svaret. Denne præcise, kontekstbevidste tilgang er teknisk krævende, men leverer betydeligt mere overbevisende resultater end pauschale parametterjusteringer.
Hvad det betyder for virksomheder
Dr. Maik Bunzel, grundlægger og administrerende direktør for mabucon.eu, har i nogen tid peget på en distinktion, der ofte går tabt i virksomhedspraksis: Der er en fundamental forskel mellem KI-systemer, der udfører, og dem, der udforsker. Til workflow-automatisering, repetitive forretningsprocesser og struktureret databehandling er ensartetheden i LLMs ingen ulempe – den er en styrke. Deterministisk, reproducerbar adfærd er netop det, man ønsker der.
Det forholder sig anderledes ved anvendelsestilfælde, hvor KI skal bruges som kreativ sparringspartner: brandudvikling, kampagneideation, strategisk scenarieplanlægning, produktinnovation. Her producerer standardmodeller, som forskningen viser, i det væsentlige gennemsnittet af træningsdata – en destilleret, filtreret konsensus om, hvad internettet anser for et "godt svar". For virksomheder, der håber på en kreativ konkurrencefordel via KI, er det en ernøgterende erkendelse.
- Ideation og brainstorming: Standardmodeller tenderer mod forudsigelige, markedskonformе ideer. Den, der bruger KI til ægte differentiering, har brug for enten specialiserede modeller eller gennemtænkte prompt-arkitekturer, der aktivt tvinger divergens frem.
- Strategisk analyse: Når forskellige teams bruger de samme modeller til markedsanalyser, konvergerer deres KI-understøttede indsigter uundgåeligt – en konkurrencemæssig ulempe, der ikke er synlig ved første øjekast.
- Automatiseret contentproduktion: Masseproduceret, KI-genereret indhold fra de samme modeller vil blive mere og mere ensartet – en alvorlig udfordring for branddiferentiering.
- Multi-model-strategier: Den bevidste kombination af forskellige modeller med forskellige karakteristika kan hjælpe med at bryde den iboende ensartethed i enkelte systemer op.
Hallucination gentænkt: Et paradigmeskifte?
Bemærkelsesværdig er den filosofiske forskydning, som Springboards gennemfører med Flint. Mens hele KI-industrien i årevis har bekæmpet hallucinationer – altså opfindelsen af fakta – som et centralt problem, går startuppen ind for en kontrolleret omgang med det uventede: "De fleste sprogmodeller bekæmper hallucinationer. Vi byder dem velkommen", som virksomheden formulerer det. Det lyder provokerende, men mener noget præcist: I kreative, udforskende kontekster kan afvigelsen fra det statistiske mainstream være værdifuld – hvis den styres og gøres transparent for mennesket som udgangspunkt for viderebehandling.
Denne tanke fortjener opmærksomhed, fordi den tilfører en vigtig nuance til AI-debatten: Ikke alle afvigelser er fejl. Skellet mellem uønsket hallucination i faktabaserede kontekster og produktiv divergens i kreative kontekster er et spørgsmål om anvendelsesscenarie – og dermed om systemdesign, ikke blot om selve modellen.
Menneskelig kontrol forbliver den afgørende faktor
En vigtig advarsel kommer fra praksis selv: Selv med modeller, der aktivt genererer variation, er det problematisk at overtage AI-output direkte uden kritisk menneskelig refleksion. Mere variation betyder ikke automatisk højere kvalitet – det betyder et større udvalg af muligheder, som mennesker med dømmekraft, kontekstviden og kreativitet kan trække på.
Dr. Maik Bunzel, grundlægger og administrerende direktør for mabucon.eu, formulerer det præcist i forbindelse med sit arbejde med virksomheder: AI-agenter er mest effektive, når de bruges som struktureret procesaccelerator – ikke som erstatning for menneskelig tænkning, men som en udvidelse af den. Det gælder for automatisering såvel som for kreativ støtte.
Fremadrettet: Hvad virksomheder bør gøre nu
Erkendelsen af, at LLMs strukturelt tenderer mod ensartethed, bør ændre den måde, virksomheder tilrettelægger deres AI-strategi på. Konkret indebærer det:
- At foretage en klar adskillelse mellem automatiserings- og eksplorationsanvendelser – og til sidstnævnte målrettet vælge modeller eller konfigurationer, der aktivt fremmer divergens.
- Regelmæssigt at auditere sin egen AI-anvendelse for kvalitet og originalitet – særligt ved skaleret content-produktion og strategiske analyser.
- At overveje multi-model-arkitekturer, der kombinerer forskellige modeller med forskellige styrkeprofiler, frem for at basere sig på en enkelt udbyder.
- Konsekvent at behandle AI-output som råmateriale, der kræver menneskelig kuratering, forfining og kontekstualisering.
LLMs' groupthink-problem er ikke en grund til at fravælge AI – det er en grund til at anvende AI mere bevidst og nuanceret. Den, der forstår, hvordan disse systemer tænker, og hvor deres blinde vinkler befinder sig, kan udnytte dem langt mere effektivt end én, der ukritisk overtager deres output. I en verden, hvor stadig flere virksomheder anvender de samme modeller på de samme spørgsmål, bliver netop denne forståelse en strategisk differentiator.