KI i produksjon er noe annet enn KI i pilot. Her er forskjellen

De fleste norske virksomheter har testet kunstig intelligens. Noen har en chatbot. Noen har eksperimentert med dokumentoppsummering. Noen har kjørt et internt pilotprosjekt som fikk gode tilbakemeldinger og deretter ble stående i kø.

Gapet mellom «vi har testet KI» og «vi bruker KI i produksjon» er større enn det ser ut til, og det er sjelden et spørsmål om modellkvalitet. Oftest handler det om infrastruktur, kontroll og driftsansvar.

For virksomheter der data er sensitiv, prosessene er tidskritiske og feilmarginene er lave, er dette gapet særlig tydelig. Offentlige skyplattformer med token-basert prising og databehandling under utenlandsk jurisdiksjon løser ikke kjerneproblemet. Mange utsetter beslutningen.

Spørsmålet alle stiller, men færre svarer på

Når virksomheter vurderer KI i produksjon, dukker ett spørsmål opp konsekvent: Hva skjer med dataene når de sendes til modellen?

For kommersielle API-baserte tjenester er svaret sjelden entydig. Data prosesseres hos en tredjepart, under leverandørens vilkår og under lovgivningen i det landet der serverne befinner seg. For mange oppgaver er dette uproblematisk. For klassifisering av sensitive dokumenter, prosessautomatisering i finans eller helsevesen, eller intern kunnskapssøk basert på fortrolig informasjon – er det ikke godt nok.

CLOUD Act gir amerikanske myndigheter rett til å kreve utlevering av data fra amerikanske skyleverandører, uavhengig av hvor serverne fysisk befinner seg. Det er ikke en teoretisk risiko. Det er en juridisk realitet som compliance-ansvarlige i regulerte bransjer allerede forholder seg til.

– For mange oppgaver leverer lokale modeller like gode resultater som de største kommersielle alternativene – til en brøkdel av token-kostnaden. Og for oppgaver der kontroll betyr mest – klassifisering, oppsummering, prosessautomatisering, intern kunnskapssøk – er lokal kjøring ikke bare et sikkerhetstiltak. Det er det eneste alternativet som faktisk holder mål, forteller Robin.

Lokale modeller i Secure Private Cloud

NetNordic Secure Private Cloud gir virksomheter mulighet til å kjøre språkmodeller og KI-workloads på dedikert GPU-infrastruktur i norske og nordiske datasentre – under norsk jurisdiksjon, ISO 27001- og ISAE 3402-sertifisert, med forutsigbar kostnad og full kontroll over dataplassering.

Det er to modeller for virksomheter med ulike behov:

Selvdrift i SPC – Virksomheter som ønsker full kontroll, kan kjøre infrastrukturen selv i Secure Private Cloud, med dedikerte servere og egne isolerte miljøer. All konfigurasjon og drift er i egne hender.

Fullstendig forvaltet tjeneste – For virksomheter som vil bruke KI uten å bygge opp et operasjonelt apparat, leverer NetNordic plattformen som en fullt forvaltet tjeneste. Oppetid, oppdateringer, skalering og sikkerhet er vårt ansvar. Virksomheten fokuserer på verdiskapningen, ikke driften.

Inferens: Der verdien faktisk realiseres

Mye KI-diskusjon handler om trening av modeller. Men for de aller fleste virksomheter er inferens det som betyr noe; det øyeblikket modellen svarer, klassifiserer, beslutter eller handler, på ekte data, i sanntid.

Inferens stiller spesifikke krav til infrastrukturen: lav latens, stabil ytelse og forutsigbar kapasitet. For tidskritiske prosesser – kvalitetskontroll på en produksjonslinje, sanntids ruteoptimalisering i forsyningskjeden, kundekommunikasjon i stor skala – er forsinkelse ikke et teknisk parameter. Det er en forretningskonsekvens.

Dedikert GPU-kapasitet optimalisert for inferens, lokalt i Norden, gir virksomheter det som offentlige skyplattformer sjelden kan garantere: forutsigbar ytelse uten avhengighet av nettverkslatens mot servere i en annen region.

Kontainerplattform med hybridkobling

Ikke alle workloads krever lokal kjøring. Et av fortrinnene med en gjennomtenkt hybridmodell er nettopp evnen til å plassere riktig workload i riktig miljø.

NetNordics kontainerplattform i Secure Private Cloud gir et moderne kjøremiljø for KI-workloads, mikrotjenester og applikasjoner – med full orkestrering, skalering og isolasjon. Gjennom sikker tilkobling mot public cloud kjøres sensitive workloads lokalt under norsk jurisdiksjon, mens produktivitetstjenester og elastiske workloads lever i Azure eller AWS der det gir best verdi.

For virksomheter som allerede kjører Kubernetes-baserte miljøer i public cloud, er dette en sømløs utvidelse – ikke et nytt prosjekt.

Model as a Service: Riktig modell til riktig oppgave

En av de mest kostbare misforståelsene i KI-prosjekter er antakelsen om at den beste modellen alltid er den største og dyreste. En kodegenerering, en dokumentklassifisering og en kundevendt chatbot har fundamentalt ulike krav til presisjon, hastighet og kostnad.

Model as a Service gir virksomheter tilgang til et kuratert utvalg av språkmodeller – hostet, forvaltet og optimalisert for de oppgavene de faktisk skal løse. Rådgivning rundt modellvalg er en del av tjenesten: hvilken modell gir best resultat for denne konkrete oppgaven, uten å bruke mer regnekraft og budsjett enn nødvendig.

Anbefalt lesning, artikkel 1 i serien: Når usikkerheten øker, blir det enda viktigere å vite hvor dataene dine ligger

Fra pilot til produksjon: Agent Lifecycle Management

De fleste virksomheter har testet KI. Færre har en strategi for å gå fra eksperiment til produksjonssatt drift. Det er her verdien lekker ut.

Agent Lifecycle Management er en strukturert tilnærming til hele løpet – fra kartlegging av manuelle prosesser som egner seg for automatisering, via design av agentinstruksjoner og produksjonssetting, til løpende monitorering og forbedring.

For produksjonsvirksomheter kan det handle om automatisert kvalitetskontroll som eskalerer avvik i sanntid. For dagligvarekjeder om agenter som optimaliserer bestilling og kampanjestyring på tvers av hundrevis av lokasjoner. For forsyningskjeder om autonome agenter som monitorerer leverandørstatus, identifiserer forsinkelser og foreslår tiltak – før problemet treffer produksjonsplanen.

Innebygde Guardrails sikrer at agentene opererer innenfor definerte grenser: ingen hallusinering, ingen uautoriserte handlinger, ingen datalekkasjer. GraphRAG optimaliserer agentens minne og kontekstforståelse, slik at den henter riktig informasjon fra riktig kilde – strukturert, sporbart og etterprøvbart.

Hva skiller lokal KI-drift fra API-baserte tjenester

Det finnes situasjoner der API-baserte modelltjenester er riktig valg. Men for virksomheter med sensitive data, krav til jurisdiksjonskontroll eller behov for forutsigbar kostnad, ser regnestykket annerledes ut:

	API-baserte modeller	NetNordic GPU-as-a-Service
Datakontroll	Data prosesseres hos tredjepart	Full kontroll i norsk SPC
Kostnad	Skalerer med token-volum	Forutsigbar, fast modell
Jurisdiksjon	Underlagt CLOUD Act / utenlandsk lov	Norsk jurisdiksjon
Inferens	Avhengig av nettverkslatens	Lokal, lav latens
Drift	Selvbetjening	Fullt forvaltet eller selvdriftet
Maskinvare	Ikke relevant	NVIDIA – levert eller som tjeneste

KI i produksjon starter med riktig fundament

Et KI-prosjekt som ikke kan skaleres til produksjon er et dyrt eksperiment. Et KI-prosjekt som skaleres på feil infrastruktur, er en compliance-risiko.

Virksomheter som tar kontroll over KI-infrastrukturen tidlig – velger riktig plassering for sensitive workloads, etablerer forutsigbar kostnad og bygger driftskapabiliteten fra starten – er de som faktisk realiserer verdien av KI, ikke bare demonstrerer den.

Vil dere forstå hva KI kan gjøre for deres virksomhet, uten å gi fra dere kontrollen? Ta kontakt for en uforpliktende gjennomgang av hva lokal KI-drift kan bety for akkurat deres prosesser og data.