OpenAI API-kostnad 2026 — komplett prisguide
Senast uppdaterad Verifierad av Aikostnad.se redaktion
OpenAI:s API-prislista 2026 har blivit både bredare och mer differentierad. Vi har nu fler än tio aktiva modeller — från ultralåga 0,15 USD/Mtok för GPT-4o mini till 60 USD/Mtok för o3 reasoning. Den här guiden går igenom alla aktiva modeller och tjänster, med konkreta räkneexempel i SEK för svenska kunder.
Vill du bara räkna ut din egen kostnad direkt? Använd kalkylatorn på startsidan — den har alla OpenAI-modeller inbyggda och räknar om till SEK med live-valutakurs.
För en bredare jämförelse mellan OpenAI och konkurrenter, se vår guide om ChatGPT vs Claude eller den kompletta AI-prisguiden.
GPT-4o och GPT-4o mini — chatt-modellerna
GPT-4o (omni) är OpenAI:s flaggskeppsmodell för chatt, multimodalitet (bild + text) och allmänna uppgifter. GPT-4o mini är den dramatiskt billigare lillebroren — samma arkitektur, mindre modell.
| Modell | Input / Mtok | Output / Mtok | SEK (in/ut) |
|---|---|---|---|
| GPT-4o | 2,50 USD | 10 USD | ~26 / ~105 kr |
| GPT-4o mini | 0,15 USD | 0,60 USD | ~1,58 / ~6,30 kr |
| GPT-4.1 | 2 USD | 8 USD | ~21 / ~84 kr |
| GPT-4.1 mini | 0,40 USD | 1,60 USD | ~4,20 / ~16,80 kr |
Vår rekommendation: börja alltid med mini. För klassificering, FAQ-svar och enklare skrivande räcker GPT-4o mini eller GPT-4.1 mini gott. Eskalera till full GPT-4o / GPT-4.1 bara när du faktiskt mäter att kvaliteten inte räcker.
o3 och o3-mini — reasoning-modellerna
OpenAI:s o-serie är specialiserad på flerstegsresonemang. Modellen "tänker" internt innan den ger sitt svar, vilket gör den dyrare per token men dramatiskt bättre på matematik, kodning och komplex analys.
| Modell | Input / Mtok | Output / Mtok | Best for |
|---|---|---|---|
| o3 | 15 USD | 60 USD | Forskning, komplex kodning, agenter |
| o3-mini | 1,10 USD | 4,40 USD | Vardaglig reasoning, kod, matte |
Viktigt: reasoning-modeller använder fler interna tokens än man tror — den "osynliga" tänkningen läggs på output. Räkna med att faktiska kostnaden blir 2–4× högre än vad token-priserna antyder för komplexa frågor.
DALL-E 3 — bildgenerering
DALL-E 3 är OpenAI:s bildmodell. Två kvalitetsnivåer:
- Standard 1024×1024: 0,04 USD per bild (~0,42 kr)
- HD 1024×1024: 0,08 USD per bild (~0,84 kr)
- Standard 1024×1792 eller 1792×1024 (porträtt/landskap): 0,08 USD
- HD 1792×1024 eller 1024×1792: 0,12 USD (~1,26 kr)
Räkneexempel: en kund som genererar 1 000 standardbilder/månad betalar 40 USD eller cirka 420 kr. Det är extremt prisvärt jämfört med stock-bilder, men för konstprojekt med högre kvalitetskrav kan Midjourney eller Flux vara bättre.
Whisper — tal-till-text
Whisper är OpenAI:s transkriberings-modell, mycket bra på svenska. Pris: 0,006 USD per minut audio (~0,063 kr/minut).
Räkneexempel: en svensk podcast-producent som transkriberar 40 timmar audio per månad betalar 14,4 USD eller cirka 150 kr. För callcenter som transkriberar 500 timmar/månad blir det 180 USD (~1 900 kr). Extremt prisvärt jämfört med manuella transkriberingstjänster (som ofta kostar 30+ kr per minut).
Embeddings — vektorer för sökning och RAG
Embeddings omvandlar text till numeriska vektorer som används för semantisk sökning och RAG-system. OpenAI har tre embedding-modeller:
- text-embedding-3-small: 0,02 USD/Mtok (~0,21 kr/Mtok) — bästa pris/prestanda
- text-embedding-3-large: 0,13 USD/Mtok (~1,37 kr/Mtok) — högre kvalitet
- text-embedding-ada-002 (legacy): 0,10 USD/Mtok — använd inte längre
Räkneexempel: embedda hela svenska Wikipedia (cirka 3 miljarder tokens) med small-modellen kostar 60 USD eller cirka 630 kr. Embedda all er produktdokumentation (säg 10 miljoner tokens) kostar 0,20 USD — i princip gratis.
Batch API — 50 % rabatt på allt
Behöver du inte svar inom millisekunder? Batch API ger 50 % rabatt mot normal pris. Du laddar upp en JSONL-fil med dina requests, OpenAI bearbetar dem inom 24 timmar och du betalar halva priset.
Bra use cases för Batch:
- Klassificering av historisk data (säg 1 miljon kundkommentarer)
- Sammanfattning av PDF-arkiv eller dokumentbibliotek
- Översättning av produktkataloger
- Embedding-pipelines för RAG-system
- Backfilling av AI-genererade fält i databaser
Räkneexempel: en kund som batch-bearbetar 100 miljoner tokens via GPT-4o-mini betalar normalt 15 USD (~158 kr). Med Batch blir det 7,50 USD (~79 kr).
Prompt caching — automatisk rabatt på återanvänd input
OpenAI har sedan oktober 2024 automatisk prompt caching som ger upp till 50 % rabatt på återanvänd input (tokens som redan setts inom ~5 minuter). Kräver ingen kodändring — aktiveras automatiskt för prompts över 1 024 tokens. Mer i vår djupguide om prompt caching.
Realistisk månadskostnad — tre svenska scenarier
Liten chatbot (5 000 frågor/mån)
- GPT-4o mini: ~15 kr/månad
- GPT-4o: ~260 kr/månad
Medel RAG-system (50 000 queries/mån)
- GPT-4o mini + embeddings: ~150 kr/månad
- GPT-4o + embeddings: ~2 600 kr/månad
- Med Batch (om asynkront): halverat
Stort B2C (500 000 frågor/mån)
- GPT-4o mini: ~1 500 kr/månad
- GPT-4o: ~26 000 kr/månad
- Med prompt caching: ~17 000 kr/månad
Relaterade guider
Vanliga frågor om OpenAI API-priser
GPT-4o mini är dramatiskt billigare: 0,15 USD per miljon input-tokens och 0,60 USD per output, mot GPT-4o:s 2,50 USD/10 USD. Det är ungefär 17 gånger billigare. För klassificering, enkla skrivuppgifter och routing räcker mini oftast — vår rekommendation är att default:a till mini och bara använda full GPT-4o när uppgiften kräver det.
o3 är OpenAI:s flaggskepp för komplext resonemang och kostar 15 USD/Mtok input och 60 USD/Mtok output — den klart dyraste modellen i sortimentet. o3-mini ligger på 1,10/4,40 USD, betydligt mer rimligt. Reasoning-modellerna 'tänker' innan de svarar och använder fler interna tokens, så faktiska kostnaden blir ofta 2–4 gånger högre än vad token-priserna antyder.
DALL-E 3 kostar 0,04 USD per standardbild (1024×1024) och 0,08 USD per HD-bild. En kund som gör 1 000 bilder/månad betalar alltså cirka 40–80 USD eller 420–840 kr. Whisper (tal-till-text) kostar 0,006 USD per minut audio — en timmes transkribering kostar 0,36 USD eller cirka 4 kr. Det är extremt prisvärt för svenska media- och callcenter-kunder.
Embeddings är numeriska representationer av text som används för semantisk sökning, RAG-system och rekommendationer. text-embedding-3-small kostar 0,02 USD/Mtok (extremt billigt — ca 0,21 kr per miljon tokens) och text-embedding-3-large 0,13 USD/Mtok. Att embedda hela svenska Wikipedia (~3 miljarder tokens) skulle kosta cirka 60 USD med small-modellen.
Batch API är OpenAI:s asynkrona variant — du skickar in en stor batch av requests, betalar 50 % av priset, och får svaren tillbaka inom 24 timmar. Perfekt för icke-tidskritiska uppgifter: dokumentanalys, klassificering av stora datamängder, embedding-pipelines, sammanfattning av många dokument. För en kund som batch-bearbetar 100 miljoner tokens kan det betyda 1 250 kr i besparing per körning.
Officiellt — nej, OpenAI har transparenta priser för alla. Men prompt caching ger upp till 50 % rabatt på återanvänd input (gäller automatiskt för långa system-promptar), Batch API ger 50 % rabatt på icke-tidskritiska jobb, och Enterprise-kunder kan förhandla custom commitments med ratesäkring och SLA via OpenAI Sales. För de flesta små och medelstora kunder är det dock prislistan som gäller.
Källor och referenser
- OpenAI API priser per modell (GPT-4o, GPT-4o mini, o3) — OpenAI
- ChatGPT Plans (Plus 20 dollar/mån, Pro 200 dollar/mån) — OpenAI
- Tokenization explained — OpenAI Platform
Räkna ut din exakta API-kostnad i SEK: Använd kalkylatorn på startsidan eller läs ChatGPT-prisguiden.