Техразбор 2026-07-01

OpenRouter июнь 2026
Токеномика победила MMLU: китайский слой ~46%

Если ваш default model в Cursor/OpenClaw выбран по MMLU 2025, вы уже отстаёте от billing-реальности: OpenRouter июнь 2026 фиксирует ~46 % недельного трафика top-8 у китайских вендоров; Google+OpenAI+Anthropic упали с 70 % до 30 % за год. Ниже — полные таблицы vendor/model, разделение volume vs quality (SWE-bench Pro, Artificial Analysis 61.4 у Opus 4.8), матрица сценариев, Q3 release map и 5-шаговый pipeline валидации complexity routing на изолированном macOS.

OpenRouter рейтинг июнь 2026: китайские ИИ-модели и доли token

01 · Все метрики OpenRouter июнь

OpenRouter — единственный публичный источник с агрегированным production token billing миллионов разработчиков. Июньский рейтинг = фактические вызовы API, не PR-бенчмарки.

Источники: OpenRouter live traffic, Artificial Analysis Intelligence Index, SWE-bench Pro (июнь 2026). Контекст: Claude Fable 5 снят с экспорта (июнь), IPO-сигналы OpenAI/Anthropic, китайские модели >60 % всех token на платформе.

Vendor rank (weekly token)

#VendorOriginWeekly tokenShare
1DeepSeek🇨🇳 China5.13T17.6%
2Anthropic🇺🇸 USA4.34T14.8%
3Google🇺🇸 USA3.66T12.5%
4OpenAI🇺🇸 USA2.46T8.4%
5Xiaomi🇨🇳 China2.42T8.3%
6MiniMax🇨🇳 China2.37T8.1%
7Tencent🇨🇳 China2.36T8.1%
8Alibaba Qwen🇨🇳 China1.26T4.3%

China aggregate (top-8): ~46 %

Model rank (daily token top-10)

#ModelVendorDaily token
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Hard numbers: DeepSeek V4 Flash 619B daily (#1); 5/10 top models — China; Claude tier держит high-value traffic.

02 · Три инженерные ошибки

1. Путать usage rank с quality rank. OpenRouter считает paid invocations, не SWE-bench. DeepSeek V4 Flash #1 из-за $/token, не из-за agent ceiling.

2. Игнорировать token economics. Dev из San Diego: Claude coding ~$10/hr, DeepSeek <$0.50/hr. Без routing policy — либо burn budget, либо under-provision на critical path.

3. Hardcode single provider перед Q3 release storm. GPT-6, Opus 5, Gemini 4, DeepSeek V5 — integration rewrite за 90 дней. См. тренды OpenRouter начала июня.

03 · США 70→30 %: чистая экономика

Bloomberg / Exponential View / OpenRouter:

  • Июнь 2025: US models ~70 % token share
  • Июнь 2026: ~30 %

40 pp ушли к китайским вендорам — преимущественно dev из US/EU/India. Драйвер: cheap + fast + good enough для 80–90 % daily tasks.

04 · Volume ≠ quality: два слоя

Quality ceiling: Claude Opus 4.8

Artificial Analysis Intelligence Index (конец мая 2026):

ModelQuality indexSWE-bench ProNote
Claude Opus 4.861.4 (#1)69.2%Long context + agent lead
GPT-5.559–6063.1%Ecosystem + tool calls
Gemini 3.1 Pro57Hard reasoning
Qwen 3.7 Max57China closed flagship
Claude Sonnet 4.680.8% (Verified)Writing + IF

20-task shootout: Opus 4.8 wins 16, GPT-5.5 5, Gemini 3.1 Pro 4 — long-context gap максимален.

Claude Fable 5: quality score 100/100, global takedown mid-June (export control). Fable 5 ban & alternatives.

Volume kings: China via unit economics

  1. Price: MiniMax M3 $0.60/M input vs Opus 4.8 $5.00/M delta
  2. Good enough: daily coding/translation ~80–90 % frontier quality
  3. Open weights: DeepSeek V4, MiniMax M3 — self-host eliminates cloud prompt leakage

Dallas stack: complex $500/mo Claude+ChatGPT; 90 % coding $200/mo MiniMax+Kimi+MiMo — complexity-based routing.

05 · Scenario matrix (июнь 2026)

ScenarioModelRationale
Complex code / agentClaude Opus 4.8Best composite, long context
Daily coding assistDeepSeek V4 Flash / MiMo-V2.5$/token + latency
Max API efficiencyMiniMax M3$0.60/M, open weights
Long contextKimi K2.6 (1M)1M window, fair price
Google stackGemini 3.5 FlashWorkspace native
Realtime webGrok 4.3X/Twitter live
Self-hostedGLM 5.2 / Kimi K2.6Top open weights
Image genChatGPT Images 2.0Text rendering
Daily chatGPT-5.5−52.5 % hallucination vs GPT-5.3

06 · H2 forecast: Q3 release density

ModelVendorETAKey spec
GPT-6OpenAIAug–Sep 20261.5M context (rumor), agent upgrade
Claude Opus 5Anthropic~Sep 2026Opus 4.8 successor, long agent
Gemini 4GoogleQ3 2026Multimodal video/audio
DeepSeek V5DeepSeekQ3 2026Open weights, >1T params
GLM 5.2Z.aiShippedTop open weight, coding
Grok 4.3+xAIQ3 20261M context, live web

Три flagship в 6-week window mid-Aug – late Sep — benchmark leadership rotate быстрее media cycle.

07 · Пять макротрендов

1. Competition axis → scenario fit — hardest 5 % closed frontier, 95 % China open weights.

2. China share ↑, enterprise compliance cap — OpenRouter retail possibly 70 %+; Fortune 500 procurement China API possibly <30 %.

3. Agent production = battlefield — Anthropic Agent Report 2026: 44 % Claude API = math/CS tasks.

4. OpenAI + Anthropic IPO — June 2026 signals; pricing transparency vs price war.

5. Local inference breakthrough — by 2027, 32GB consumer GPU >80 % SWE-bench; см. локальный DeepSeek на Mac.

08 · Margin compression & provider-agnostic arch

Model layer commoditizing: DeepSeek 2025 доказал efficiency без peak CAPEX; Xiaomi/Tencent/MiniMax/Moonshot скопировали floor pricing. US split: OpenAI ecosystem, Anthropic quality moat, Google speed/multimodal.

High-value skill: не pick #1 model, а build switchable routing — июньский лидер через квартал может быть #4.

09 · 5 шагов: routing validation pipeline

  1. Аренда clean macOS: Mac mini M4, SSH; local user без prod Apple ID.
  2. OpenRouter + complexity routing: sandbox .env; peak anthropic/claude-opus-4.8, daily deepseek/deepseek-v4-flash or minimax/minimax-m3.
  3. 20-task benchmark: log USD cost, p95 latency, tool-call success — replicate Opus-16/GPT-5 methodology.
  4. Wire Cursor or OpenClaw Gateway: model ID swap без business code diff; check 1M context gateway timeout.
  5. Export CSV + release: revoke test keys, disk wipe, commit routing rules to team wiki.
# Complexity routing (OpenRouter)
export OPENROUTER_API_KEY="sk-or-..."
# Daily: DeepSeek V4 Flash (~$0.10/M in)
# Peak: Claude Opus 4.8 ($5.00/M in)

Multi-key + CLI + OpenClaw Gateway + Xcode signing на одном MacBook = quota burn + Keychain pollution risk. Изолированная посуточная аренда для A/B routing — тарифы bare-metal, FAQ SSH/VNC.