OpenRouter 주간 토큰 순위
청구 데이터는 거짓말하지 않는다
MMLU 순위만 보고 팀 기본 모델을 정하고 OpenRouter 주간 토큰 처리량을 무시한다면, 벤치마크와 실제 청구를 싸우게 두는 셈입니다. 이 글은 멀티모델 라우팅을 담당하는 개발자·테크 리드에게 2026년 5–6월 주간 데이터로 28.9조 토큰 규모, 미·중 점유, Anthropic «프리미엄 역설»을 해석하고, 토큰 점유 대 달러 수익 결정 매트릭스와 5단계 주간 검증 절차를 제공합니다.
📋 목차
01 · 왜 청구 데이터가 벤치마크보다 신뢰되는가
벤치마크는 «고정 문제집에서 누가 높은 점수를 받는가»를 묻습니다. OpenRouter 주간 순위는 «지난 7일 동안 개발자가 실제로 얼마나 많은 토큰을 소모했는가»를 묻습니다. 전자는 타깃 최적화의 대상이 되고, 후자는 실제 지출 행동입니다. 돈은 거짓말하지 않습니다.
OpenRouter는 300개 이상 모델·60개 이상 공급자를 묶는 중립 API 레이어로, 월간 약 100조 토큰, 사용자 800만 명 이상 규모로 알려져 있습니다. 주간 순위가 연속 상승하는 모델은 보도자료의 SOTA가 아니라 프로덕션 트래픽 이동을 뜻합니다. OpenRouter 트렌드와 Agent 선정이 거시 흐름을 다룬다면, 본문은 주간 청구 기준과 프리미엄 역설에 집중합니다.
02 · 데이터 출처와 통계 방법
공개 페이지: openrouter.ai/rankings. 집계는 7일 롤링 토큰 처리량(입력+출력)이며 모델·벤더별 드릴다운이 가능합니다. 본문 기준값은 다음과 같습니다.
- 앵커 주(2026/5/18–5/24): 글로벌 주간 약 28.9조 토큰, 전주 대비 +7.4%(5주 연속 증가).
- 최신 주(2026년 6월 초): Tool Calling 집합에서 DeepSeek V4 Flash 약 3.14T, Tencent Hy3 Preview 약 2.75T, Xiaomi MiMo-V2.5 약 2.3T 등——읽을 때는 반드시 라이브 데이터를 확인하세요.
순위를 읽을 때 토큰 점유(트래픽 지배력)와 달러 수익 점유(단가×사용량)를 함께 봐야 합니다. 토큰만 보면 Claude를 과소평가하고, 달러만 보면 «미국 폐쇄형이 여전히 지배»로 오해하기 쉽습니다.
03 · 세 가지 인지 페인
1. 키노트를 선정 근거로 삼는다. 데모는 베스트 케이스이고, 주간 통계는 cron·배치·Agent 루프에서 실패 재시도도 과금되는 현실입니다. DeepSeek V4 Flash가 주간 1위인 이유는 저단가·1M 컨텍스트·안정적 툴 루프에 대한 집단 투표입니다.
2. «토큰량 ≠ 달러 수익»을 간과한다. Anthropic 토큰 점유는 약 12%(1년 전 약 25%)까지 떨어졌지만 달러 수익 점유는 약 46%입니다. 트래픽만 쫓으면 엔터프라이즈 컴플라이언스용 Claude Opus 프리미엄을 놓치고, 수익만 보면 «오픈소스가 전부 잡았다»고 착각합니다.
3. 본번 Mac에서 모델을 로테이션한다. 매주 기본 라우트를 바꾸고 여러 CLI를 설치하면 Keychain과 전역 설정이 오염됩니다. Agent Skill 격리 가이드와 같이 버릴 수 있는 임대 macOS에서 주간 청구와 지연을 대조한 뒤 팀에 확산하는 것이 안전합니다.
04 · 글로벌 주간: 28.9조 토큰과 미·중 구도
| 지표 | 수치(5/18–5/24 주) | 전주 대비 |
|---|---|---|
| 글로벌 주간 호출 | 28.9조 토큰 | +7.4% |
| 중국 모델 주간 | 9.223조 토큰 | +19.89% |
| 미국 모델 주간 | 4.93조 토큰 | +16.27% |
| 중 vs 미 | 중국 모델이 4주 연속 주간 토큰에서 미국 초과 | |
약 1년 전 주간 처리량은 2.4조, 2026년 5월은 28.9조——1년 만에 약 12배 규모입니다. LLM 호출은 실험에서 프로덕션 스케일로 넘어갔습니다. 한국 팀에게도 API 지연·대역폭이 선정의 1차 요인이 되고 있습니다.
| 시점 | 중국 모델 트래픽 점유(참고) |
|---|---|
| 2025년 초 | < 2% |
| 2026년 2월 | 첫 주간 미국 초과 |
| 2026년 5월 | 45%+, 4주 연속 1위 |
05 · 당주 모델 Top 10(다주 대조)
주간 순위는 회전이 빠릅니다. 아래 표는 5월 하순 앵커와 6월 초 Tool Calling 공개값을 병기해 «누가 실제로 호출되는가»를 보여 줍니다.
| 순위 | 모델 | 벤더 | 주간 토큰 | 특징 |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek 🇨🇳 | 3.43T → ~3.14T | Agent용, 초저단가, 1M ctx |
| 2 | Tencent Hy3 Preview | Tencent 🇨🇳 | 3.07T → ~2.75T | 오픈 MoE |
| 3 | Owl Alpha | Stealth | ~1.15T → ~1.92T | 장 ctx Agent 특화 |
| 4–5 | V4 Pro / V3.2 | DeepSeek 🇨🇳 | 매트릭스 | 동일 벤더 3모델 상위 |
| 6 | Claude Sonnet 4.6 | Anthropic 🇺🇸 | ~1.35T → ~1.77T | 엔터프라이즈 코드 |
| 7 | Xiaomi MiMo-V2.5 | Xiaomi 🇨🇳 | — → ~2.3T | 6월 급상승 |
| 8 | MiniMax M3 | MiniMax 🇨🇳 | — → ~1.68T | 장 ctx 가성비 |
| 9 | Step 3.7 Flash | StepFun 🇨🇳 | — → ~654B | 배치 저단가 |
| 10 | Gemini 3 Flash Preview | Google 🇺🇸 | ~1.06T → ~1.02T | 멀티모달 |
DeepSeek 계열은 5월 하순 주간 합계 약 5.74조 토큰(+25.9%)으로 벤더 차원에서 Anthropic·Google을 2주 연속 앞섰습니다. 이것이 청구 레이어의 승자입니다.
06 · 벤더 구도: 토큰과 달러의 이중 구조
| 벤더 | 토큰 점유 | 달러 수익 점유 | 해석 |
|---|---|---|---|
| Anthropic | ~12% | ~46% | 트래픽은 양보, 단가 프리미엄 유지 |
| ~13% | ~7% | Flash 볼륨, 수익은 완만 | |
| OpenAI | ~10% | ~24% | GPT-5.x 고단가 |
| 중국 OSS 군 | 45%+ | 한 자릿수 % | 극저단가로 토큰 흡수 |
시장은 단일 승자가 아니라 계층화되고 있습니다. 고단가·저트래픽 Claude Opus, 중간 Gemini Flash, 극저단가·고트래픽 DeepSeek/Xiaomi/MiniMax/StepFun——용도별 분화가 진행 중입니다. Claude Opus 4.6 월 수익은 제3자 추정 약 2,500만 달러인데 토큰량은 DeepSeek 헤드의 극히 일부입니다. 이것이 프리미엄 역설입니다.
07 · 역설: 벤치 점수와 점유는 거의 반비례
OpenRouter와 a16z의 《2025 AI Usage Report》(약 100조 토큰 익명 메타데이터)에 따르면 벤치마크 점수와 실제 점유는 거의 반비례합니다. 이유는 명확합니다.
- 개발자는 추론 비용을 극한 능력보다 우선합니다;
- Agent는 단발 추론보다 API 안정성·툴 성공률·지연에 의존합니다;
- 코딩 용도는 OpenRouter 트래픽의 11%→50% 초과로 확대되어 최대 카테고리가 됐습니다——«충분히 싸고 충분히 좋은» 모델이 선택됩니다.
결론: 청구 숫자가 어떤 순위보다 정직합니다. LMSYS 순위로 라우트를 정한다면 매주 «openrouter.ai/rankings + 자사 Stripe/OpenRouter 청구» 이중 축으로 전환하세요.
08 · 주간 순위가 상업화 바로미터가 된 이유
투자자는 도입 속도의 대리 지표로, 개발자는 벤더 중립 라우트 기준으로, 연구자는 지정학·기술 경로 변화 추적에 씁니다. OpenRouter PS 배수 26×급 보도도 있으며, 토큰 처리량은 LLM 시대의 클라우드 비용 곡선에 해당합니다. macOS 팀에게는 어떤 OSS 계열을 Apple Silicon에 미러할지 신호가 되기도 합니다.
09 · 시나리오별 라우팅 결정 표
| 시나리오 | 우선 모델 | 청구 논리 |
|---|---|---|
| Agent / 배치 cron | DeepSeek V4 Flash | 주간 #1, 초저단가 |
| 복잡 추론 / 컴플라이언스 | Claude Opus / Sonnet 4.6 | 달러 점유 높음, 툴 성숙 |
| 멀티모달 문서 | Gemini 3 Flash | 전 모달 + 중단가 |
| 신규 모델 시험 | Hy3 Preview / Owl Alpha | 주간 성장률이 선행 지표 |
| 데이터 레지던시 | ds4 + V4 Flash | ds4 로컬 가이드 |
매주 월요일 15분: 순위 스크린샷, Usage CSV보내기, 위 표에 맞춘 model ID 업데이트——분기 키노트 추적보다 효율적입니다.
10 · 5단계 주간 라우팅 검증(HowTo)
- 격리 macOS 임대: Mac mini M4부터. SSH 접속, 본번 Apple ID는 사용하지 않습니다.
- 주간 순위 기록: rankings Top10과 자사 지난주 토큰/달러를 저장합니다.
- 고정 A/B: V4 Flash, Sonnet 4.6, Hy3에 동일 12k 토큰+툴 호출 작업을 실행합니다.
- 라우트 설정: openclaw.json / Cursor에 기본·폴백·예산 상한을 기록합니다.
- CSV 저장 및 반납: 증적을 남기고 테스트 키를 폐기한 뒤 무잔류로 반납합니다.
# 자사 키 사용량(OpenRouter 문서 기준)curl -H "Authorization: Bearer $OPENROUTER_API_KEY" \ https://openrouter.ai/api/v1/auth/key# 주간 model ID와 대조open https://openrouter.ai/rankings
노트북에서 라우트를 바꿀 수도 있지만 Xcode 서명·본번 키·실험 OpenClaw가 공존하면 Opus 단가를 배치에 흘려보내는 사고가 나기 쉽습니다. 감사 가능한 «주간 순위—청구—지연» 삼연 증거가 필요하다면 독립 임대 macOS에서 검증 후 확산하는 편이 Studio 일시불보다 가볍고 본번 Mac 오염보다 안전합니다. 요금은 M 시리즈 요금 안내, SSH는 일일 Mac 임대 FAQ를 참고하세요.