AI-ordlista — termer för AI-kostnader på svenska
Senast uppdaterad Verifierad av Aikostnad.se redaktion
Svenska företag möter AI-terminologin på engelska — det här är 39 av de viktigaste begreppen översatta och förklarade. Klicka på länkade termer för fördjupning.
A
Abonnemang
Fast månadsavgift för åtkomst till AI-tjänst (t.ex. ChatGPT Plus 210 kr/mån). Motsats till API-prissättning per token.
Agent
AI som kan utföra sekvenser av handlingar (söka, klicka, skriva kod) autonomt — inte bara svara på frågor.
Anthropic
Amerikanskt AI-företag bakom Claude-modellerna. Konkurrent till OpenAI och Google. Läs mer →
API (Application Programming Interface)
Programmatiskt sätt att anropa en AI-modell från egen kod. Du betalar per token istället för fast månadsavgift.
B
Batch API
Asynkron väg att skicka många AI-anrop med rabatt (OpenAI ger 50 %). Lämpar sig för icke-tidskritiska arbetsbelastningar.
Bias
Systematisk skevhet i en AI-modells svar — beror på träningsdata. Viktig att förstå för rättvis användning.
C
Chain of Thought (CoT)
Tekniken att be en modell 'tänka högt' steg för steg innan slutsvar. Höjer noggrannheten på resonemangsuppgifter — och tokenkostnaden.
ChatGPT
OpenAI:s chatprodukt. Använder GPT-4o eller o3 under huven. Inte samma sak som OpenAI API. Läs mer →
Claude
Anthropics AI-modellfamilj: Haiku (snabb/billig), Sonnet (balans), Opus (flaggskepp). Läs mer →
Context window
Hur mycket text modellen kan 'se' samtidigt — mätt i tokens. Claude Sonnet: 200K, Gemini 2.5 Pro: 1M tokens.
D
DALL-E
OpenAI:s bildgenereringsmodell. DALL-E 3 ingår i ChatGPT Plus eller via API. Läs mer →
DPA (Data Processing Addendum)
Juridiskt avtal som krävs för GDPR-efterlevnad vid behandling av personuppgifter. Ingår oftast i Enterprise-versioner, inte gratis-tier.
E
Embedding
Numerisk representation av text som möjliggör semantiska sökningar och RAG. Billigare än chattanrop.
F
Fine-tuning
Att vidare-träna en bas-modell på egen data för specifik uppgift. Sänker per-anropskostnad vid hög volym men har upfront-kostnad.
G
Gemini
Googles AI-modellfamilj. Gemini 2.5 Pro/Flash är aktuella API-modellerna 2026. Läs mer →
GPT (Generative Pre-trained Transformer)
OpenAI:s familj av språkmodeller. GPT-4o, GPT-4.1 och GPT-4o mini är de mest använda 2026. Läs mer →
GPU (Graphics Processing Unit)
Specialiserad processor som krävs för att köra stora AI-modeller. Cloudkostnad ~3 kr/timme och uppåt.
H
Hallucination
När en AI-modell hittar på fakta som låter trovärdiga men är felaktiga. Större problem med flaggskeppsmodeller än reasoning-modeller (o3).
I
Inference
Att köra (inte träna) en AI-modell — alltså varje gång du skickar en fråga. Inferenskostnad = vad du betalar API.
Input tokens
Tokens i frågan du skickar till modellen. Vanligen billigare än output-tokens (förhållande ungefär 1:4).
J
JSON mode
Inställning som tvingar modellen att svara i strikt JSON-format. Sparar tokens och underlättar parsing i applikationer.
L
LLM (Large Language Model)
Samlingsterm för stora språkmodeller som GPT-4, Claude, Gemini, Llama. 'Stora' = miljarder parametrar.
Llama
Open source LLM-familj från Meta. Llama 4 är aktuell 2026. Gratis att ladda ner — du betalar GPU-kostnad.
M
Mistral
Franskt AI-företag med open-source-modeller (Mistral Small/Medium/Large). Populärt EU-alternativ för GDPR-känsliga applikationer.
Multimodal
AI som kan hantera flera datatyper — text, bild, ljud, video. GPT-4o och Gemini är multimodala; GPT-4.1 är textfokuserad.
O
OpenAI
Företaget bakom ChatGPT, GPT-4, DALL-E och o-serien. Världens största AI-företag mätt i konsumentanvändare 2026. Läs mer →
Output tokens
Tokens i modellens svar. Dyrare än input (typiskt 4×). Att begränsa svarens längd är en av de enklaste sätten att spara pengar.
P
Prompt
Instruktionen du ger AI-modellen. Kan bestå av system-prompt (regler), user-prompt (frågan) och eventuella exempel.
Prompt caching
Återanvänd en bearbetad prompt för rabatt (Anthropic 90 %, OpenAI 50 %). Halverar ofta totalkostnaden för chatbots. Läs mer →
Prompt engineering
Konsten att skriva effektiva promptar — viktigaste skillnaden mellan amatör- och proffsresultat med samma modell.
R
RAG (Retrieval Augmented Generation)
Att hämta in relevant data från vektor-databas och stoppa in i prompten innan modellen svarar. Hur de flesta AI-chatbots fungerar idag.
Reasoning tokens
Tokens som o3/o3-mini använder internt för att tänka innan svar. Du betalar för dem men ser dem inte. Kan vara 5-10× normal output-volym.
RLHF (Reinforcement Learning from Human Feedback)
Träningsteknik där människor rangordnar modellsvar för att lära modellen vad som är bra svar. Grunden för moderna AI-assistenter.
S
Stable Diffusion
Open source bildgenereringsmodell. Gratis att köra själv. Aktiv community med tusentals anpassade modeller (LoRAs). Läs mer →
System prompt
Instruktionen som sätter modellens beteende ('du är en hjälpsam assistent som svarar på svenska'). Vanligt mål för caching.
T
Token
Den minsta textenheten en AI-modell bearbetar. Engelska: ~0,75 token/ord. Svenska: ~1,3 token/ord (73 % dyrare per ord).
Tokenisering
Processen att dela upp text i tokens. Varje modell har egen tokenizer — GPT-4 och Claude har olika.
Transformer
Den neurala arkitektur som ligger bakom alla moderna LLM. Uppfunnen av Google 2017 ('Attention is All You Need').
V
Vector database
Databas optimerad för att lagra och söka embeddings. Pinecone, Weaviate, pgvector. Krävs för RAG-applikationer.
Hittade du inte termen? Hör av dig så lägger vi till den. Redo att räkna på kostnader? Använd kalkylatorn.
Relaterade guider
Källor och referenser
- OpenAI API Pricing — OpenAI (officiell prislista)
- Anthropic Claude Pricing — Anthropic (officiell prislista)
- Google Gemini API Pricing — Google (officiell prislista)
- ChatGPT Plans (Free, Plus, Pro, Business, Enterprise) — OpenAI (officiell abonnemangsida)