📋 Sommaire

01 · Chiffres OpenRouter juin

OpenRouter agrège les appels réels de millions de développeurs mondiaux. Le classement de juin reflète la confiance opérationnelle en production, pas la notoriété marketing.

Sources : trafic OpenRouter en direct, Artificial Analysis Intelligence Index, SWE-bench Pro (juin 2026). Contexte : retrait mondial de Claude Fable 5 (contrôle des exportations), rumeurs d'IPO chez OpenAI et Anthropic, part chinoise >60 % des tokens sur la plateforme.

Par éditeur (tokens hebdomadaires)

Rang	Éditeur	Origine	Tokens/semaine	Part
1	DeepSeek	🇨🇳 Chine	5.13T	17.6%
2	Anthropic	🇺🇸 États-Unis	4.34T	14.8%
3	Google	🇺🇸 États-Unis	3.66T	12.5%
4	OpenAI	🇺🇸 États-Unis	2.46T	8.4%
5	Xiaomi	🇨🇳 Chine	2.42T	8.3%
6	MiniMax	🇨🇳 Chine	2.37T	8.1%
7	Tencent	🇨🇳 Chine	2.36T	8.1%
8	Alibaba Qwen	🇨🇳 Chine	1.26T	4.3%

Total Chine (top 8) : ~46 %

Par modèle (tokens journaliers, top 10)

Rang	Modèle	Éditeur	Tokens/jour
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Faits saillants : DeepSeek V4 Flash 619B tokens/jour ; 5 modèles chinois dans le top 10 ; la gamme Claude conserve une part significative de trafic à haute valeur.

02 · Trois angles morts décisionnels

1. Confondre classement d'usage et classement de qualité. OpenRouter mesure fréquence et budget, pas SWE-bench. DeepSeek V4 Flash domine par l'économie unitaire.

2. Sous-estimer l'économie du token. Témoignage d'un développeur californien : « Claude pour coder, environ 10 $ de l'heure. DeepSeek, moins de 50 cents. » Sans politique de routage, l'équipe soit dépasse son enveloppe, soit sacrifie la qualité sur les tâches critiques.

3. Verrouiller un seul fournisseur avant la vague Q3. GPT-6, Opus 5, Gemini 4, DeepSeek V5 arrivent — l'intégration figée devient une dette en 90 jours. Voir notre analyse tendances OpenRouter de début juin.

03 · USA 70→30 % : une bascule économique

Les données citées par Bloomberg et Exponential View sont sans ambiguïté :

Juin 2025 : modèles US ~70 % des tokens OpenRouter
Juin 2026 : ~30 %

Les 40 points manquants sont captés par les éditeurs chinois — majoritairement par des équipes US, européennes et indiennes. Le critère n'est pas patriotique : prix, latence, suffisance pour le travail quotidien.

04 · Volume ≠ qualité : deux registres

Plafond qualité : Claude Opus 4.8

Artificial Analysis Intelligence Index (fin mai 2026) :

Modèle	Indice qualité	SWE-bench Pro	Commentaire
Claude Opus 4.8	61.4 (#1)	69.2%	Long contexte & agent en tête
GPT-5.5	59–60	63.1%	Écosystème & tool calls
Gemini 3.1 Pro	57	—	Raisonnement difficile
Qwen 3.7 Max	57	—	Flagship chinois fermé
Claude Sonnet 4.6	—	80.8% (Verified)	Rédaction & instructions

Benchmark 20 tâches : Opus 4.8 remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4 — écart marqué sur long contexte.

Claude Fable 5 : note 100/100, retiré mondialement mi-juin (export). Détails : interdiction Fable 5 & alternatives.

Champions du volume : la Chine par le rapport qualité-prix

Prix : MiniMax M3 0,60 $ / M entrée vs Claude Opus 4.8 5,00 $ / M — ratio 1/8
Suffisance : assistance code, complétion, résumé ~80–90 % du niveau premium
Poids ouverts : DeepSeek V4, MiniMax M3 — déploiement on-premise pour données sensibles

Stack type (Dallas) : tâches complexes 500 $ / mois Claude + ChatGPT ; 90 % du coding quotidien 200 $ / mois MiniMax + Kimi + MiMo.

05 · Matrice scénarios (juin 2026)

Scénario	Modèle recommandé	Justification
Code complexe / agent	Claude Opus 4.8	Meilleure qualité globale, long contexte
Assistance quotidienne	DeepSeek V4 Flash / MiMo-V2.5	Excellent rapport coût/vitesse
API ultra-compétitive	MiniMax M3	0,60 $ / M, poids ouverts
Long contexte	Kimi K2.6 (1M)	Fenêtre étendue, tarif raisonnable
Écosystème Google	Gemini 3.5 Flash	Intégration Workspace
Web temps réel	Grok 4.3	Flux X/Twitter
Auto-hébergement	GLM 5.2 / Kimi K2.6	Meilleurs poids ouverts
Génération d'images	ChatGPT Images 2.0	Rendu texte supérieur
Dialogue quotidien	GPT-5.5	−52,5 % d'hallucinations vs GPT-5.3

06 · Prévisions S2 : saison des sorties Q3

Modèle	Éditeur	Calendrier	Enjeu
GPT-6	OpenAI	août–sept. 2026	1,5M contexte (rumeur), agents renforcés
Claude Opus 5	Anthropic	~sept. 2026	Successeur Opus 4.8, agents longue durée
Gemini 4	Google	T3 2026	Multimodal, vidéo & audio
DeepSeek V5	DeepSeek	T3 2026	Poids ouverts, >1T paramètres
GLM 5.2	Z.ai	Publié	Poids ouverts de référence
Grok 4.3+	xAI	T3 2026	1M contexte, web live

Trois flagships pourraient atterrir dans une fenêtre de six semaines (mi-août – fin septembre) — le leadership benchmark changera plus vite que le cycle presse.

07 · Cinq tendances macro

1. De « le plus fort » à « le plus adapté » — 5 % frontier fermé, 95 % poids ouverts chinois pour le volume.

2. Part chinoise en hausse, plafond enterprise — trafic individuel OpenRouter possible >70 % ; achats Fortune 500 Chine possible <30 %.

3. Les agents en production décident — rapport Anthropic 2026 : 44 % des appels Claude API en maths/informatique.

4. IPO OpenAI & Anthropic — signaux juin 2026 ; pression sur transparence tarifaire et guerre des prix.

5. Inférence locale — d'ici 2027, modèle local 32 Go GPU >80 % SWE-bench ; voir DeepSeek local sur Mac.

08 · Compression des marges et architecture agnostique

La couche modèle se commoditise : DeepSeek a prouvé l'efficacité sans hyper-CAPEX ; Xiaomi, Tencent, MiniMax et Moonshot ont aligné les prix plancher. Les US jouent écosystème (OpenAI), qualité (Anthropic) ou vitesse/multimodal (Google).

Compétence clé en 2026 : construire une stack capable de changer de modèle sans refonte — le leader de juin peut être relégué en octobre.

09 · Cinq étapes : valider le routage multi-modèles

Louer un macOS propre : Mac mini M4, SSH ; utilisateur local sans Apple ID prod.
OpenRouter + routage complexité : .env sandbox ; pic anthropic/claude-opus-4.8, quotidien deepseek/deepseek-v4-flash ou minimax/minimax-m3.
Benchmark 20 tâches : coût USD, latence, succès tool-call — méthodologie Opus-16 / GPT-5.
Cursor ou OpenClaw Gateway : changement d'ID sans toucher au code métier ; timeout 1M contexte.
Exporter CSV & libérer : révoquer clés test, effacement disque, documenter les règles.

                        # Routage par complexité (OpenRouter)

                        export OPENROUTER_API_KEY="sk-or-..."

                        # Quotidien : DeepSeek V4 Flash (~$0.10/M in)

                        # Pic : Claude Opus 4.8 ($5.00/M in)

Empiler clés multiples, CLI, OpenClaw et signature Xcode sur le MacBook de production expose quotas et Keychain. Une location journalière isolée valide le routage avant déploiement — tarifs : bare-metal macOS ; accès : FAQ location Mac.