📋 Inhalt

01 · OpenRouter Juni: alle Kennzahlen

OpenRouter aggregiert reale Token-Abrechnungen globaler Entwickler — kein Marketing-Benchmark, sondern produktive Nutzung. Die Juni-2026-Zahlen zeigen, welche Modelle Teams tatsächlich in Pipelines, Agents und IDEs einsetzen.

Quellen: OpenRouter Live-Traffic, Artificial Analysis Intelligence Index, SWE-bench Pro (Stand Juni 2026). Kontext: Claude Fable 5 wegen Exportkontrolle Mitte Juni global offline; OpenAI und Anthropic meldeten IPO-Interesse; chinesische Modelle überschreiten auf OpenRouter 60 % aller Token (Gesamtplattform).

Nach Anbieter (Wochen-Token)

Rang	Anbieter	Herkunft	Wochen-Token	Anteil
1	DeepSeek	🇨🇳 China	5.13T	17.6%
2	Anthropic	🇺🇸 USA	4.34T	14.8%
3	Google	🇺🇸 USA	3.66T	12.5%
4	OpenAI	🇺🇸 USA	2.46T	8.4%
5	Xiaomi	🇨🇳 China	2.42T	8.3%
6	MiniMax	🇨🇳 China	2.37T	8.1%
7	Tencent	🇨🇳 China	2.36T	8.1%
8	Alibaba Qwen	🇨🇳 China	1.26T	4.3%

China gesamt (Top-8): ~46 %

Nach Modell (Tages-Token Top 10)

Rang	Modell	Anbieter	Tages-Token
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Kernzahlen: DeepSeek V4 Flash 619B Tages-Token (#1); 5 von 10 Top-Modellen aus China; Anthropic-Claude-Tier hält signifikanten High-Value-Anteil.

02 · Drei Entscheidungsfehler (datengetrieben)

1. Ranking mit Qualitätsliste verwechseln. OpenRouter misst Zahlungsbereitschaft und Aufrufhäufigkeit, nicht SWE-bench. DeepSeek V4 Flash führt wegen Preis/Leistung — nicht weil es jeden Agent-Edge-Case schlägt.

2. Abrechnung ohne Compliance-Layer. Ein Entwickler aus San Diego: «Claude fürs Coden, ~10 USD/Stunde. DeepSeek, unter 50 Cent.» Für EU-Teams kommt hinzu: Prompts mit personenbezogenen Daten über chinesische Endpunkte können DSGVO-Art. 44-Transfer auslösen — Routing muss Datenklassen trennen, nicht nur Token minimieren.

3. Single-Provider-Lock-in vor Q3-Release-Welle. GPT-6, Opus 5, Gemini 4, DeepSeek V5 stehen an. Hart codierte Provider-IDs erzwingen Integrations-Rewrites innerhalb von 90 Tagen — siehe OpenRouter-Trendanalyse Juni.

03 · USA 70→30 %: Ökonomie, nicht Patriotismus

Bloomberg/OpenRouter/Exponential View dokumentieren den Shift:

Juni 2025: US-Modelle (Google + OpenAI + Anthropic) ~70 % Token-Anteil
Juni 2026: ~30 %

Die fehlenden 40 Prozentpunkte wandern zu chinesischen Anbietern — überwiegend von Entwicklern in USA, EU und Indien, nicht nur Inlandsadoption. Treiber: günstig, schnell, ausreichend für 80–90 % der Alltagsaufgaben.

04 · Volumen ≠ Qualität: zwei Layer lesen

Qualitätsdecke: Claude Opus 4.8

Artificial Analysis Intelligence Index (Ende Mai 2026):

Modell	Qualitätsindex	SWE-bench Pro	Anmerkung
Claude Opus 4.8	61.4 (#1)	69.2%	Langkontext & Agent führend
GPT-5.5	59–60	63.1%	Ökosystem & Tool-Calls
Gemini 3.1 Pro	57	—	Schwere Reasoning-Tasks
Qwen 3.7 Max	57	—	Chinesisches Closed-Source-Flaggschiff
Claude Sonnet 4.6	—	80.8% (Verified)	Schreiben & Instruction-Following

20-Task-Vergleich: Opus 4.8 gewinnt 16, GPT-5.5 5, Gemini 3.1 Pro 4 — bei Langkontext dominiert Opus.

Claude Fable 5: Qualitätsrating 100/100, Mitte Juni wegen Exportkontrolle global offline. Siehe Fable-5-Sperre & Alternativen.

Volumen-Champion: China via Preis-Leistung

Preis: MiniMax M3 $0.60/M Input vs. Claude Opus 4.8 $5.00/M — Faktor 1/8
Ausreichend: Coding-Hilfe, Completion, Übersetzung ~80–90 % Top-Qualität
Open Weights: DeepSeek V4, MiniMax M3 — Self-Hosting für datensensitive Workloads (DSGVO-freundlicher als reine Cloud-Prompts)

Stack eines Dallas-Teams: komplex $500/Monat Claude + ChatGPT; Alltag 90 % Coding $200/Monat MiniMax + Kimi + MiMo — Routing nach Komplexität.

05 · Szenario-Matrix (Juni 2026)

Szenario	Empfohlenes Modell	Begründung
Komplexer Code / Agent	Claude Opus 4.8	Höchste Gesamtqualität, Langkontext
Tägliches Coding	DeepSeek V4 Flash / MiMo-V2.5	Preis/Leistung, niedrige Latenz
Maximale API-Effizienz	MiniMax M3	$0.60/M, Open Weights, Self-Host
Langkontext	Kimi K2.6 (1M context)	Sehr großes Fenster, fairer Preis
Google-Ökosystem	Gemini 3.5 Flash	Workspace-nativ
Echtzeit-Web	Grok 4.3	X/Twitter-Livefeed
Self-Hosted	GLM 5.2 / Kimi K2.6	Top Open-Weight-Optionen
Bildgenerierung	ChatGPT Images 2.0	Stärkste Textdarstellung
Alltagsdialog	GPT-5.5	52.5 % weniger Halluzination vs. GPT-5.3

06 · H2-Prognosen: Q3-Release-Dichte

Modell	Anbieter	Erwartung	Fokus
GPT-6	OpenAI	Aug.–Sep. 2026	1.5M Kontext (Gerücht), stärkere Agents
Claude Opus 5	Anthropic	~Sep. 2026	Nachfolger Opus 4.8, Lang-Agent
Gemini 4	Google	Q3 2026	Multimodal, Video/Audio
DeepSeek V5	DeepSeek	Q3 2026	Open Weights, >1T Parameter
GLM 5.2	Z.ai	Bereits live	Top Open Weight, starkes Coding
Grok 4.3+	xAI	Q3 2026	1M Kontext, Live-Web

Drei Flaggschiffe könnten in einem 6-Wochen-Fenster Mitte Aug.–Ende Sep. landen — Benchmark-Führung wechselt schneller als Medienzyklen.

07 · Fünf Makrotrends

1. Wettbewerb verschiebt sich zu Szenario-Fit — schwierigste 5 % an Closed-Source-Frontier, 95 % an chinesische Open Weights.

2. China-Anteil steigt, Enterprise-Compliance bremst — OpenRouter-Privatnutzer evtl. 70 %+; Fortune-500-Einkauf evtl. <30 % China-API.

3. Agent-Produktion ist der eigentliche Kampf — Anthropic Agent Report 2026: 44 % Claude-API-Calls Mathe/Informatik.

4. OpenAI + Anthropic IPO — Juni 2026 IPO-Signale; transparentere Preise oder Preiskrieg mit China möglich.

5. Lokale Inferenz — bis 2027 32GB-GPU-Local >80 % SWE-bench; siehe DeepSeek lokal auf Mac.

08 · Margendruck & modellagnostische Architektur

Die Modell-Schicht wird zur Commodity: DeepSeek 2025 bewies Effizienz ohne Spitzen-CAPEX; Xiaomi, Tencent, MiniMax, Moonshot folgten. US-Strategien divergieren: OpenAI Ökosystem, Anthropic Qualität, Google Speed/Multimodal.

Wertvollster Skill 2026: nicht «das beste Modell wählen», sondern Architektur bauen, die Provider wechseln kann — der Juni-#1 ist in drei Monaten vielleicht #4.

09 · Fünf Schritte: Multi-Modell-Routing validieren

Sauberes macOS mieten: Mac mini M4, SSH; lokaler User ohne Produktions-Apple-ID.
OpenRouter + Komplexitäts-Routing: Sandbox-.env; Spitze anthropic/claude-opus-4.8, Alltag deepseek/deepseek-v4-flash oder minimax/minimax-m3.
20-Task-Benchmark: USD-Kosten, Latenz, Tool-Call-Rate — Opus-16/GPT-5-Methodik replizieren.
Cursor oder OpenClaw Gateway: Modell-ID-Wechsel ohne Code-Änderung; 1M-Kontext-Timeout prüfen.
CSV exportieren & freigeben: Test-Keys widerrufen, Disk wipe, Routing-Doku für Team.

                        # Komplexitäts-Routing (OpenRouter)

                        export OPENROUTER_API_KEY="sk-or-..."

                        # Alltag: DeepSeek V4 Flash (~$0.10/M in)

                        # Spitze: Claude Opus 4.8 ($5.00/M in)

Multi-Key, CLI, OpenClaw Gateway und Xcode-Signatur auf einem MacBook erhöhen Quota- und Keychain-Risiko. Isolierte Tagesmiete benchmarkt Routing sauber — siehe M-Serie-Preise und Tagesmiete-FAQ.