AI-ordlista — termer, tokens, API och prismodeller förklarade | Aikostnad.se

AI-ordlista — termer för AI-kostnader på svenska

Senast uppdaterad Verifierad av Aikostnad.se redaktion

Svenska företag möter AI-terminologin på engelska — det här är 39 av de viktigaste begreppen översatta och förklarade. Klicka på länkade termer för fördjupning.

A

Abonnemang

Fast månadsavgift för åtkomst till AI-tjänst (t.ex. ChatGPT Plus 210 kr/mån). Motsats till API-prissättning per token.

Agent

AI som kan utföra sekvenser av handlingar (söka, klicka, skriva kod) autonomt — inte bara svara på frågor.

Anthropic

Amerikanskt AI-företag bakom Claude-modellerna. Konkurrent till OpenAI och Google. Läs mer →

API (Application Programming Interface)

Programmatiskt sätt att anropa en AI-modell från egen kod. Du betalar per token istället för fast månadsavgift.

B

Batch API

Asynkron väg att skicka många AI-anrop med rabatt (OpenAI ger 50 %). Lämpar sig för icke-tidskritiska arbetsbelastningar.

Bias

Systematisk skevhet i en AI-modells svar — beror på träningsdata. Viktig att förstå för rättvis användning.

C

Chain of Thought (CoT)

Tekniken att be en modell 'tänka högt' steg för steg innan slutsvar. Höjer noggrannheten på resonemangsuppgifter — och tokenkostnaden.

ChatGPT

OpenAI:s chatprodukt. Använder GPT-4o eller o3 under huven. Inte samma sak som OpenAI API. Läs mer →

Claude

Anthropics AI-modellfamilj: Haiku (snabb/billig), Sonnet (balans), Opus (flaggskepp). Läs mer →

Context window

Hur mycket text modellen kan 'se' samtidigt — mätt i tokens. Claude Sonnet: 200K, Gemini 2.5 Pro: 1M tokens.

D

DALL-E

OpenAI:s bildgenereringsmodell. DALL-E 3 ingår i ChatGPT Plus eller via API. Läs mer →

DPA (Data Processing Addendum)

Juridiskt avtal som krävs för GDPR-efterlevnad vid behandling av personuppgifter. Ingår oftast i Enterprise-versioner, inte gratis-tier.

E

Embedding

Numerisk representation av text som möjliggör semantiska sökningar och RAG. Billigare än chattanrop.

F

Fine-tuning

Att vidare-träna en bas-modell på egen data för specifik uppgift. Sänker per-anropskostnad vid hög volym men har upfront-kostnad.

G

Gemini

Googles AI-modellfamilj. Gemini 2.5 Pro/Flash är aktuella API-modellerna 2026. Läs mer →

GPT (Generative Pre-trained Transformer)

OpenAI:s familj av språkmodeller. GPT-4o, GPT-4.1 och GPT-4o mini är de mest använda 2026. Läs mer →

GPU (Graphics Processing Unit)

Specialiserad processor som krävs för att köra stora AI-modeller. Cloudkostnad ~3 kr/timme och uppåt.

H

Hallucination

När en AI-modell hittar på fakta som låter trovärdiga men är felaktiga. Större problem med flaggskeppsmodeller än reasoning-modeller (o3).

I

Inference

Att köra (inte träna) en AI-modell — alltså varje gång du skickar en fråga. Inferenskostnad = vad du betalar API.

Input tokens

Tokens i frågan du skickar till modellen. Vanligen billigare än output-tokens (förhållande ungefär 1:4).

J

JSON mode

Inställning som tvingar modellen att svara i strikt JSON-format. Sparar tokens och underlättar parsing i applikationer.

L

LLM (Large Language Model)

Samlingsterm för stora språkmodeller som GPT-4, Claude, Gemini, Llama. 'Stora' = miljarder parametrar.

Llama

Open source LLM-familj från Meta. Llama 4 är aktuell 2026. Gratis att ladda ner — du betalar GPU-kostnad.

M

Mistral

Franskt AI-företag med open-source-modeller (Mistral Small/Medium/Large). Populärt EU-alternativ för GDPR-känsliga applikationer.

Multimodal

AI som kan hantera flera datatyper — text, bild, ljud, video. GPT-4o och Gemini är multimodala; GPT-4.1 är textfokuserad.

O

OpenAI

Företaget bakom ChatGPT, GPT-4, DALL-E och o-serien. Världens största AI-företag mätt i konsumentanvändare 2026. Läs mer →

Output tokens

Tokens i modellens svar. Dyrare än input (typiskt 4×). Att begränsa svarens längd är en av de enklaste sätten att spara pengar.

P

Prompt

Instruktionen du ger AI-modellen. Kan bestå av system-prompt (regler), user-prompt (frågan) och eventuella exempel.

Prompt caching

Återanvänd en bearbetad prompt för rabatt (Anthropic 90 %, OpenAI 50 %). Halverar ofta totalkostnaden för chatbots. Läs mer →

Prompt engineering

Konsten att skriva effektiva promptar — viktigaste skillnaden mellan amatör- och proffsresultat med samma modell.

R

RAG (Retrieval Augmented Generation)

Att hämta in relevant data från vektor-databas och stoppa in i prompten innan modellen svarar. Hur de flesta AI-chatbots fungerar idag.

Reasoning tokens

Tokens som o3/o3-mini använder internt för att tänka innan svar. Du betalar för dem men ser dem inte. Kan vara 5-10× normal output-volym.

RLHF (Reinforcement Learning from Human Feedback)

Träningsteknik där människor rangordnar modellsvar för att lära modellen vad som är bra svar. Grunden för moderna AI-assistenter.

S

Stable Diffusion

Open source bildgenereringsmodell. Gratis att köra själv. Aktiv community med tusentals anpassade modeller (LoRAs). Läs mer →

System prompt

Instruktionen som sätter modellens beteende ('du är en hjälpsam assistent som svarar på svenska'). Vanligt mål för caching.

T

Token

Den minsta textenheten en AI-modell bearbetar. Engelska: ~0,75 token/ord. Svenska: ~1,3 token/ord (73 % dyrare per ord).

Tokenisering

Processen att dela upp text i tokens. Varje modell har egen tokenizer — GPT-4 och Claude har olika.

Transformer

Den neurala arkitektur som ligger bakom alla moderna LLM. Uppfunnen av Google 2017 ('Attention is All You Need').

V

Vector database

Databas optimerad för att lagra och söka embeddings. Pinecone, Weaviate, pgvector. Krävs för RAG-applikationer.

Hittade du inte termen? Hör av dig så lägger vi till den. Redo att räkna på kostnader? Använd kalkylatorn.

Relaterade guider

Källor och referenser