Tokenräknare — räkna tokens i din text | Aikostnad.se

Tokenräknare för AI

Klistra in vilken text som helst för att se hur många tokens den innehåller och vad det kostar att skicka till olika AI-modeller.

Tokenräknare

Klistra in din text nedan för att se hur många tokens den är värd och vad det kostar. Använder 1.3 tokens/ord för svenska texter.

Varför fler tokens för svenska?

De flesta stora AI-modeller (GPT, Claude, Gemini) är tränade primärt på engelska text. Engelskans tokenizer delar upp text i ungefär 0,75 tokens per ord — ett genomsnittligt engelskt ord ryms alltså inom en enda token.

Svenska skiljer sig på två sätt. Dels har svenska många långa sammansatta ord, som "järnvägsstationen" eller "förhandlingsprotokoll", som tokenizern delar upp i flera delar. Dels är tecknen å, ä och ö sällsynta i träningsdatan och kodas ofta som två tokens vardera snarare än ett.

I praktiken landar svenska texter på ca 1,2–1,5 tokens per ord, med ett medelvärde på ungefär 1,3. Det innebär att din svenska prompt kostar ungefär 73 % mer att processa jämfört med en textmässigt likvärdig engelsk text.

Kalkylatorn ovan tar hänsyn till detta när den beräknar kostnaden. Tokenräknaren nedan visar det faktiska tokenantalet baserat på cl100k_base — samma tokenizer som OpenAI GPT-4o och liknande modeller använder.

Tips: Vill du sänka AI-kostnaden direkt? Skriv dina systempromptar på engelska. Det ger färre tokens, kortare svarstider och lägre kostnad — utan att du behöver byta modell.

Vad är en token? Förklarat enkelt

En token är den minsta textenhet en AI-modell arbetar med. Det är varken ett tecken eller ett ord — det är något mittemellan. Moderna tokenizers (som BPE, Byte Pair Encoding) delar upp text i vanliga teckenföljder baserat på hur ofta de förekommer i träningsdatan.

Några konkreta exempel på hur engelska tokeniseras:

  • Hello = 1 token
  • ChatGPT = 2 tokens (Chat + GPT)
  • tokenization = 3 tokens (token + ization → token / iz / ation)
  • järnvägsstationen = 6–8 tokens (svenska sammansatta ord slås sönder)

En tumregel som håller ganska bra för engelska: 1 000 tokens ≈ 750 ord, eller ungefär tre sidor A4-text. För svenska: 1 000 tokens ≈ 570 ord.

AI-leverantörer debiterar alltid per token, inte per ord eller tecken. Det är därför tokentalet är den relevanta enheten när du räknar ut vad en prompt faktiskt kostar.

Token-kostnader per modell — en snabb jämförelse

Alla priser nedan är i USD per miljon tokens (input / output) och gäller standardprislistan utan rabatter. Priserna uppdateras löpande — se aktuella priser i kronor på kalkylatorn.

ModellInput / M tokensOutput / M tokensPassar för
GPT-4o$2,50$10,00Avancerade uppgifter, multimodalt
GPT-4o mini$0,15$0,60Hög volym, enkla uppgifter
Claude Sonnet 4$3,00$15,00Kodning, analys, långa texter
Claude Haiku 3.5$0,80$4,00Snabb, kostnadseffektiv
Gemini 1.5 Pro$1,25$5,00Lång kontext (upp till 2M tokens)
Gemini 1.5 Flash$0,075$0,30Billigast, snabb svarstid

Output-tokens kostar typiskt 4–5× mer än input. Välj modell utifrån uppgiftens komplexitet — inte bara pris.

Hur minskar du token-kostnaderna?

Fem konkreta åtgärder du kan göra utan att byta modell eller sänka kvaliteten på svaren.

  1. 1
    Skriv systempromptar på engelskaSvenska systempromptar kostar 73 % mer per ord. Håll instruktionerna på engelska och låt bara användarens faktiska fråga vara på svenska.
  2. 2
    Begränsa output-längdenOutput-tokens kostar 4–5× mer än input. Lägg till en instruktion som "Svara i max 3 meningar" eller "Ge bara det viktigaste" för att skära ner onödig text.
  3. 3
    Aktivera prompt cachingUpprepar du samma systemprompt i varje anrop? Med prompt caching betalar du bara för de faktiska ändringarna — upp till 90 % rabatt på cachead input.
  4. 4
    Välj rätt modell för uppgiftenGPT-4o mini och Claude Haiku är 10–20× billigare än sina respektive flaggskepp och klarar de flesta rutinuppgifter lika bra. Använd de dyrare modellerna bara när komplexiteten kräver det.
  5. 5
    Trimma kontextfönstretSkickar du hela konversationshistoriken vid varje anrop? Det är ett vanligt mönster som snabbt blåser upp token-räkningen. Skicka bara de senaste 3–5 turerna — modellen klarar sig oftast utmärkt ändå.

Vanliga frågor om tokens

Är tokeniseringen identisk för alla AI-modeller?

Nej. OpenAI GPT-4 och GPT-4o använder cl100k_base, medan äldre GPT-modeller använde p50k. Claude och Gemini har egna tokenizers som ger ungefär samma antal tokens men inte exakt samma. Skillnaden är vanligtvis under 5 % — tillräckligt liten för budgetberäkningar. Vår räknare använder cl100k_base som approximation.

Räknas bilder och filer som tokens?

Ja. Bilder i multimodala modeller som GPT-4o och Claude konverteras till en fast mängd tokens beroende på bildstorlek och detaljnivå. En liten bild på 512×512 px kostar exempelvis ca 170 tokens hos OpenAI. Den här räknaren hanterar bara text.

Hur stor är skillnaden mellan svenska och engelska i praktiken?

Klistra in en text på svenska, notera tokenantalet, och jämför med en Google-översättning av samma text på engelska — vanligtvis ser du 20–40 % färre tokens på engelska. Åtgärder som att skriva systempromptar på engelska kan därför spara tusentals kronor per månad vid hög volym.

Vad innebär "kontextfönster" och varför spelar det roll?

Kontextfönstret är det maximala antal tokens en modell kan hantera i en och samma konversation — input och output tillsammans. GPT-4o har 128 000 tokens, Claude Sonnet 200 000 och Gemini 1.5 Pro upp till 2 miljoner. Om du skickar långa konversationshistoriker riskerar du dels att nå taket, dels att betala för tokens som modellen ändå ignorerar (äldre kontext värderas lägre).

Relaterade guider