Veille marché 2026-07-01

OpenRouter juin 2026
Le basculement géographique du trafic IA est déjà acté

Pour un CTO ou un lead platform qui arbitre encore sur les classements MMLU de l'an dernier, les données OpenRouter de juin 2026 constituent un signal plus fiable que tout communiqué éditeur : les éditeurs chinois pèsent environ 46 % du top firmes, tandis que le trio américain (Google, OpenAI, Anthropic) est passé de 70 % à 30 % en douze mois. Cette note professionnelle décline classements par éditeur et par modèle, distingue volume et qualité, propose une matrice de choix par scénario, anticipe les sorties Q3 et livre une checklist en cinq étapes pour valider un routage multi-modèles sur macOS isolé.

Classement OpenRouter juin 2026 et part des modèles chinois

01 · Chiffres OpenRouter juin

OpenRouter agrège les appels réels de millions de développeurs mondiaux. Le classement de juin reflète la confiance opérationnelle en production, pas la notoriété marketing.

Sources : trafic OpenRouter en direct, Artificial Analysis Intelligence Index, SWE-bench Pro (juin 2026). Contexte : retrait mondial de Claude Fable 5 (contrôle des exportations), rumeurs d'IPO chez OpenAI et Anthropic, part chinoise >60 % des tokens sur la plateforme.

Par éditeur (tokens hebdomadaires)

RangÉditeurOrigineTokens/semainePart
1DeepSeek🇨🇳 Chine5.13T17.6%
2Anthropic🇺🇸 États-Unis4.34T14.8%
3Google🇺🇸 États-Unis3.66T12.5%
4OpenAI🇺🇸 États-Unis2.46T8.4%
5Xiaomi🇨🇳 Chine2.42T8.3%
6MiniMax🇨🇳 Chine2.37T8.1%
7Tencent🇨🇳 Chine2.36T8.1%
8Alibaba Qwen🇨🇳 Chine1.26T4.3%

Total Chine (top 8) : ~46 %

Par modèle (tokens journaliers, top 10)

RangModèleÉditeurTokens/jour
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Faits saillants : DeepSeek V4 Flash 619B tokens/jour ; 5 modèles chinois dans le top 10 ; la gamme Claude conserve une part significative de trafic à haute valeur.

02 · Trois angles morts décisionnels

1. Confondre classement d'usage et classement de qualité. OpenRouter mesure fréquence et budget, pas SWE-bench. DeepSeek V4 Flash domine par l'économie unitaire.

2. Sous-estimer l'économie du token. Témoignage d'un développeur californien : « Claude pour coder, environ 10 $ de l'heure. DeepSeek, moins de 50 cents. » Sans politique de routage, l'équipe soit dépasse son enveloppe, soit sacrifie la qualité sur les tâches critiques.

3. Verrouiller un seul fournisseur avant la vague Q3. GPT-6, Opus 5, Gemini 4, DeepSeek V5 arrivent — l'intégration figée devient une dette en 90 jours. Voir notre analyse tendances OpenRouter de début juin.

03 · USA 70→30 % : une bascule économique

Les données citées par Bloomberg et Exponential View sont sans ambiguïté :

  • Juin 2025 : modèles US ~70 % des tokens OpenRouter
  • Juin 2026 : ~30 %

Les 40 points manquants sont captés par les éditeurs chinois — majoritairement par des équipes US, européennes et indiennes. Le critère n'est pas patriotique : prix, latence, suffisance pour le travail quotidien.

04 · Volume ≠ qualité : deux registres

Plafond qualité : Claude Opus 4.8

Artificial Analysis Intelligence Index (fin mai 2026) :

ModèleIndice qualitéSWE-bench ProCommentaire
Claude Opus 4.861.4 (#1)69.2%Long contexte & agent en tête
GPT-5.559–6063.1%Écosystème & tool calls
Gemini 3.1 Pro57Raisonnement difficile
Qwen 3.7 Max57Flagship chinois fermé
Claude Sonnet 4.680.8% (Verified)Rédaction & instructions

Benchmark 20 tâches : Opus 4.8 remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4 — écart marqué sur long contexte.

Claude Fable 5 : note 100/100, retiré mondialement mi-juin (export). Détails : interdiction Fable 5 & alternatives.

Champions du volume : la Chine par le rapport qualité-prix

  1. Prix : MiniMax M3 0,60 $ / M entrée vs Claude Opus 4.8 5,00 $ / M — ratio 1/8
  2. Suffisance : assistance code, complétion, résumé ~80–90 % du niveau premium
  3. Poids ouverts : DeepSeek V4, MiniMax M3 — déploiement on-premise pour données sensibles

Stack type (Dallas) : tâches complexes 500 $ / mois Claude + ChatGPT ; 90 % du coding quotidien 200 $ / mois MiniMax + Kimi + MiMo.

05 · Matrice scénarios (juin 2026)

ScénarioModèle recommandéJustification
Code complexe / agentClaude Opus 4.8Meilleure qualité globale, long contexte
Assistance quotidienneDeepSeek V4 Flash / MiMo-V2.5Excellent rapport coût/vitesse
API ultra-compétitiveMiniMax M30,60 $ / M, poids ouverts
Long contexteKimi K2.6 (1M)Fenêtre étendue, tarif raisonnable
Écosystème GoogleGemini 3.5 FlashIntégration Workspace
Web temps réelGrok 4.3Flux X/Twitter
Auto-hébergementGLM 5.2 / Kimi K2.6Meilleurs poids ouverts
Génération d'imagesChatGPT Images 2.0Rendu texte supérieur
Dialogue quotidienGPT-5.5−52,5 % d'hallucinations vs GPT-5.3

06 · Prévisions S2 : saison des sorties Q3

ModèleÉditeurCalendrierEnjeu
GPT-6OpenAIaoût–sept. 20261,5M contexte (rumeur), agents renforcés
Claude Opus 5Anthropic~sept. 2026Successeur Opus 4.8, agents longue durée
Gemini 4GoogleT3 2026Multimodal, vidéo & audio
DeepSeek V5DeepSeekT3 2026Poids ouverts, >1T paramètres
GLM 5.2Z.aiPubliéPoids ouverts de référence
Grok 4.3+xAIT3 20261M contexte, web live

Trois flagships pourraient atterrir dans une fenêtre de six semaines (mi-août – fin septembre) — le leadership benchmark changera plus vite que le cycle presse.

07 · Cinq tendances macro

1. De « le plus fort » à « le plus adapté »5 % frontier fermé, 95 % poids ouverts chinois pour le volume.

2. Part chinoise en hausse, plafond enterprise — trafic individuel OpenRouter possible >70 % ; achats Fortune 500 Chine possible <30 %.

3. Les agents en production décident — rapport Anthropic 2026 : 44 % des appels Claude API en maths/informatique.

4. IPO OpenAI & Anthropic — signaux juin 2026 ; pression sur transparence tarifaire et guerre des prix.

5. Inférence locale — d'ici 2027, modèle local 32 Go GPU >80 % SWE-bench ; voir DeepSeek local sur Mac.

08 · Compression des marges et architecture agnostique

La couche modèle se commoditise : DeepSeek a prouvé l'efficacité sans hyper-CAPEX ; Xiaomi, Tencent, MiniMax et Moonshot ont aligné les prix plancher. Les US jouent écosystème (OpenAI), qualité (Anthropic) ou vitesse/multimodal (Google).

Compétence clé en 2026 : construire une stack capable de changer de modèle sans refonte — le leader de juin peut être relégué en octobre.

09 · Cinq étapes : valider le routage multi-modèles

  1. Louer un macOS propre : Mac mini M4, SSH ; utilisateur local sans Apple ID prod.
  2. OpenRouter + routage complexité : .env sandbox ; pic anthropic/claude-opus-4.8, quotidien deepseek/deepseek-v4-flash ou minimax/minimax-m3.
  3. Benchmark 20 tâches : coût USD, latence, succès tool-call — méthodologie Opus-16 / GPT-5.
  4. Cursor ou OpenClaw Gateway : changement d'ID sans toucher au code métier ; timeout 1M contexte.
  5. Exporter CSV & libérer : révoquer clés test, effacement disque, documenter les règles.
# Routage par complexité (OpenRouter)
export OPENROUTER_API_KEY="sk-or-..."
# Quotidien : DeepSeek V4 Flash (~$0.10/M in)
# Pic : Claude Opus 4.8 ($5.00/M in)

Empiler clés multiples, CLI, OpenClaw et signature Xcode sur le MacBook de production expose quotas et Keychain. Une location journalière isolée valide le routage avant déploiement — tarifs : bare-metal macOS ; accès : FAQ location Mac.