
KI-API Preisvergleich: OpenAI, Anthropic, Google & Co.
Aktuelle Preise pro 1M Token für die wichtigsten KI-APIs – Input, Output und Kontext-Fenster im Vergleich.
Die API-Kosten von KI-Modellen variieren enorm – von unter 0,10 $ bis über 60 $ pro Million Token. Diese Tabelle gibt einen Überblick über die aktuellen Preise der wichtigsten Anbieter für ihre Flagship- und Budget-Modelle.
Alle Preise in USD pro 1 Million Token (Stand März 2026). Output-Tokens sind bei allen Anbietern teurer als Input-Tokens.
| Modell | Anbieter | Input $/1M | Output $/1M | Kontext |
|---|---|---|---|---|
| GPT-4o | OpenAI | 2,50 | 10,00 | 128K |
| GPT-4o mini | OpenAI | 0,15 | 0,60 | 128K |
| GPT-4.5 Preview | OpenAI | 75,00 | 150,00 | 128K |
| o3-mini | OpenAI | 1,10 | 4,40 | 200K |
| Claude 3.5 Sonnet | Anthropic | 3,00 | 15,00 | 200K |
| Claude 3.5 Haiku | Anthropic | 0,80 | 4,00 | 200K |
| Claude 3 Opus | Anthropic | 15,00 | 75,00 | 200K |
| Gemini 2.0 Flash | 0,10 | 0,40 | 1M | |
| Gemini 1.5 Pro | 1,25 | 5,00 | 2M | |
| DeepSeek V3 | DeepSeek | 0,27 | 1,10 | 128K |
| DeepSeek R1 | DeepSeek | 0,55 | 2,19 | 128K |
| Llama 3.1 405B | Meta (via API) | 3,00 | 3,00 | 128K |
| Mistral Large | Mistral | 2,00 | 6,00 | 128K |
| Grok-2 | xAI | 2,00 | 10,00 | 128K |
Preise Stand März 2026 – können sich jederzeit ändern.
Output-Token-Preise beziehen sich auf Standard-Anfragen (kein Batch/Cached Pricing).
Lokales Hosting (Llama, Mistral) hat keine Token-Kosten, aber Hardware- und Stromkosten.
Passende Rechner
Verwandte Ratgeber
Häufig gestellte Fragen
Welche KI-API ist am günstigsten?
Google Gemini 2.0 Flash ist mit 0,10 $/1M Input-Token derzeit die günstigste Option unter den Flagship-Anbietern. DeepSeek V3 bietet ein ähnlich gutes Preis-Leistungs-Verhältnis. Für einfache Aufgaben ist GPT-4o mini mit 0,15 $/1M Input ebenfalls sehr günstig.
Lohnt sich lokales LLM-Hosting vs. API?
Bei hohem Volumen (>100M Token/Monat) kann lokales Hosting günstiger sein – vorausgesetzt, Sie haben die Hardware. Berechnen Sie die TCO mit unserem Inferenzkosten-Rechner: Hardware + Strom vs. API-Kosten.
Warum sind Output-Tokens teurer als Input-Tokens?
Output-Generierung erfordert mehr Rechenleistung: Jeder Token wird sequenziell generiert, während Input-Tokens parallel verarbeitet werden können. Das Output/Input-Preisverhältnis liegt typischerweise bei 2:1 bis 5:1.
Quellen
- [1] OpenAI – Pricing Page (platform.openai.com/pricing)
- [2] Anthropic – API Pricing (anthropic.com/pricing)
- [3] Google – Gemini API Pricing (ai.google.dev/pricing)
- [4] DeepSeek – API Pricing (platform.deepseek.com)