KI-API Preisvergleich: OpenAI, Anthropic, Google & Co.
TABELLE14 Modelle· Aktualisiert März 2026

KI-API Preisvergleich: OpenAI, Anthropic, Google & Co.

Aktuelle Preise pro 1M Token für die wichtigsten KI-APIs – Input, Output und Kontext-Fenster im Vergleich.

Die API-Kosten von KI-Modellen variieren enorm – von unter 0,10 $ bis über 60 $ pro Million Token. Diese Tabelle gibt einen Überblick über die aktuellen Preise der wichtigsten Anbieter für ihre Flagship- und Budget-Modelle.

Alle Preise in USD pro 1 Million Token (Stand März 2026). Output-Tokens sind bei allen Anbietern teurer als Input-Tokens.

GPT-4o
AnbieterOpenAI
Input $/1M2,50
Output $/1M10,00
Kontext128K
GPT-4o mini
AnbieterOpenAI
Input $/1M0,15
Output $/1M0,60
Kontext128K
GPT-4.5 Preview
AnbieterOpenAI
Input $/1M75,00
Output $/1M150,00
Kontext128K
o3-mini
AnbieterOpenAI
Input $/1M1,10
Output $/1M4,40
Kontext200K
Claude 3.5 Sonnet
AnbieterAnthropic
Input $/1M3,00
Output $/1M15,00
Kontext200K
Claude 3.5 Haiku
AnbieterAnthropic
Input $/1M0,80
Output $/1M4,00
Kontext200K
Claude 3 Opus
AnbieterAnthropic
Input $/1M15,00
Output $/1M75,00
Kontext200K
Gemini 2.0 Flash
AnbieterGoogle
Input $/1M0,10
Output $/1M0,40
Kontext1M
Gemini 1.5 Pro
AnbieterGoogle
Input $/1M1,25
Output $/1M5,00
Kontext2M
DeepSeek V3
AnbieterDeepSeek
Input $/1M0,27
Output $/1M1,10
Kontext128K
DeepSeek R1
AnbieterDeepSeek
Input $/1M0,55
Output $/1M2,19
Kontext128K
Llama 3.1 405B
AnbieterMeta (via API)
Input $/1M3,00
Output $/1M3,00
Kontext128K
Mistral Large
AnbieterMistral
Input $/1M2,00
Output $/1M6,00
Kontext128K
Grok-2
AnbieterxAI
Input $/1M2,00
Output $/1M10,00
Kontext128K

Preise Stand März 2026 – können sich jederzeit ändern.

Output-Token-Preise beziehen sich auf Standard-Anfragen (kein Batch/Cached Pricing).

Lokales Hosting (Llama, Mistral) hat keine Token-Kosten, aber Hardware- und Stromkosten.

Passende Rechner

Verwandte Ratgeber

Häufig gestellte Fragen

Welche KI-API ist am günstigsten?

Google Gemini 2.0 Flash ist mit 0,10 $/1M Input-Token derzeit die günstigste Option unter den Flagship-Anbietern. DeepSeek V3 bietet ein ähnlich gutes Preis-Leistungs-Verhältnis. Für einfache Aufgaben ist GPT-4o mini mit 0,15 $/1M Input ebenfalls sehr günstig.

Lohnt sich lokales LLM-Hosting vs. API?

Bei hohem Volumen (>100M Token/Monat) kann lokales Hosting günstiger sein – vorausgesetzt, Sie haben die Hardware. Berechnen Sie die TCO mit unserem Inferenzkosten-Rechner: Hardware + Strom vs. API-Kosten.

Warum sind Output-Tokens teurer als Input-Tokens?

Output-Generierung erfordert mehr Rechenleistung: Jeder Token wird sequenziell generiert, während Input-Tokens parallel verarbeitet werden können. Das Output/Input-Preisverhältnis liegt typischerweise bei 2:1 bis 5:1.

Quellen

  • [1] OpenAI – Pricing Page (platform.openai.com/pricing)
  • [2] Anthropic – API Pricing (anthropic.com/pricing)
  • [3] Google – Gemini API Pricing (ai.google.dev/pricing)
  • [4] DeepSeek – API Pricing (platform.deepseek.com)