Omkostninger 7. maj 2026 · 7 min læsning

Sådan beregner du ROI for privat AI

En simpel ramme til at sammenligne on-premise vs. målbaseret cloud – og finde dit break-even.

Enhver leder, der spørger "bør vi self-hoste vores AI?", stiller i virkeligheden et finansielt spørgsmål. Modellerne, infrastrukturen, leverandørernes løfter – alt det kollapser til ét tal: koster det mindre end at betale pr. token, og med hvor meget? Dette indlæg giver dig en gentagelig ramme til at besvare det spørgsmål ærligt med rigtige inputs og en klar break-even-kurve.

Hvorfor cloud AI-regninger eksploderer i stor skala

Tidlige piloter på administrerede API'er føles billige. Ti ingeniører, der sender et par tusinde prompts om dagen, registreres næsten ikke på en kreditkortregning. Men i det øjeblik et værktøj går org-wide – tænk Uber, der udrulter Copilot til 30.000 medarbejdere – akkumulerer prissætning pr. token hurtigt. En model, der håndterer 10 millioner tokens om dagen til 0,002 € pr. tusinde output-tokens, koster 7.300 € om måneden inden nogen finjustering, lagring eller egress. Tilføj retrieval-augmented generation-pipelines og agentiske loops, og den samme arbejdsbyrde kan forbruge fem til ti gange så meget. Måleren sover aldrig, og den bryder sig ikke om, hvorvidt outputtet var nyttigt.

De to omkostningsbeholdere, du skal modellere

On-premise AI har to distinkte omkostningsbeholdere. Kapitaludgifter dækker hardwaren: GPU-servere, netværk, rack-plads og den engangs Privonis-implementerings- og integrationsgebyr. Driftsudgifter dækker elektricitet, vedligeholdelseskontrakter og den brøkdel af en ingeniørs tid, der bruges på at holde stakken sund. Cloud AI har én beholder: en forbrugsregning, der skalerer lineært (eller værre) med volumen. ROI-beregningen er simpelthen den kumulative cloud-regning minus den kumulative on-premise-omkostning over en given horisont.

CapEx: GPU-serverhardware (typisk 40.000-120.000 € pr. node afhængigt af GPU-niveau)
CapEx: Privonis-implementering, integration og første-års-support
OpEx: elektricitet (∼0,15 €/kWh × server TDP × timer)
OpEx: sysadmin-tid (estimer 0,25 FTE i det første år)
Cloud-baseline: pr.-token-omkostning × månedligt tokenvolumen × måneder
Cloud-ekstra: finjusteringsjobs, embedding-lagring, API-egress-gebyrer

Kumulative omkostningskurver for on-premise vs. cloud AI over 36 måneder — Krydspunktet er dit break-even. Ud over det er on-premise strengt billigere.

Tegning af break-even-kurven

Tegn to linjer på en månedlig akse. On-premise-linjen starter højt (CapEx) og vokser langsomt (OpEx-hældning). Cloud-linjen starter tæt på nul og stiger stejlt med forbrug. Hvor de krydser, er din break-even-måned. For de fleste europæiske midtmarkedsvirksomheder, der kører dokumentbehandling, intern chat eller kodeassistance i stor skala, ankommer det kryds mellem måned 14 og måned 22. Organisationer med følsomme data, der ellers ville kræve databehandlingsaftaler, opholdsstedskontroller og revisionslogning på cloud-siden, finder ofte break-even ankommer endnu tidligere, fordi de sande cloud-omkostninger inkluderer compliance-overhead.

Produktivitetsgevinster: den anden side af regnstykket

ROI er ikke kun omkostningsundgåelse. Hver time en vidensmedarbejder sparer gennem AI-assistance er fakturerbar eller geninvesterbar. Et konservativt estimat for juridiske, finans- eller ingeniørteams er 30 minutter sparet pr. medarbejder pr. dag. Ved en gennemsnitlig fuldt belastet omkostning på 50 € pr. time og 50 medarbejdere er det 1.250 € af genoprettet kapacitet pr. arbejdsdag – over 300.000 € årligt. Privonis-klienter måler disse gevinster via brugsdashboards inkluderet i platformen, så produktivitetsargumentet ikke er anekdotisk men sporet.

Omkostning pr. forespørgsel falder efterhånden som on-premise AI skalerer til flere brugere — On-premise marginalomkostning pr. forespørgsel nærmer sig nul efterhånden som brugerantallet vokser. Cloud-marginalomkostning forbliver flad.

Et gennemregnet eksempel

Overvej en 200-personers professionel servicevirksomhed, der behandler kontrakter, udarbejder klientrapporter og kører en intern Q&A-bot over en 15 GB vidensbase. Cloud-omkostningsestimat: 80 millioner tokens om måneden til blandet 0,003 €/1k tokens = 240 €/måned – nej, vent. Til 200 brugere, der hver genererer 400k tokens om måneden er det 80 millioner tokens: 240 € om måneden lyder lavt, men tilføjelse af finjusteringsamortisering, embedding-opdatering og et premium-niveau for pålidelighed skubber den virkelige regning til 3.800 €/måned eller 45.600 €/år. On-premise med en enkelt Privonis-implementeret node: hardware 65.000 € CapEx, 800 €/måned OpEx. Kumulativ 36-måneders cloud-omkostning: 136.800 €. Kumulativ 36-måneders on-premise-omkostning: 93.800 €. Nettobesparing over tre år: 43.000 € – plus fuld datasuverænitet.

Tilbagebetalingsperiode og følsomhedsanalyse

Tilbagebetalingsperiode er CapEx divideret med månedlige besparelser. I eksemplet ovenfor: 65.000 € ÷ (3.800 € − 800 €) = 21,7 måneder. Kør en følsomhedsgennemgang: hvis tokenomkostninger falder 30 % (rimeligt givet modelkommoditisering), forlænges tilbagebetaling til 28 måneder – stadig inden for en typisk serverlevetid. Hvis forbrug vokser 50 % år-over-år (almindeligt, når AI er indlejret i arbejdsgange), forkortes tilbagebetaling til 15 måneder. Modellen er ikke skrøbelig. Privonis leverer et tilpasseligt ROI-regneark som en del af opdagelsesprocessen, så klienter kan bruge deres egne antagelser inden de forpligter sig.

Spørgsmålet er ikke, om privat AI er billigere – i meningsfuld skala er det det næsten altid. Spørgsmålet er hvornår og med hvor meget. Modelér det ærligt, og svaret overrasker normalt finansteams.

Næste trin

Hvis din organisation behandler mere end 20 millioner tokens om måneden, eller forudser at nå dette volumen inden tolv måneder, er en on-premise ROI-analyse en eftermiddags regneark-tid værd. Privonis tilbyder et gratis 60-minutters opdagelsesopkald for at gennemgå tallene sammen, kortlægge dine arbejdsbyrder og producere en realistisk break-even-projektion skræddersyet til din infrastruktur og teamstørrelse. Omkostningen af opkaldet er nul; omkostningen ved ikke at modellere det kan være seks cifre.

Lad os tale om dit AI-projekt

Book et opkald