📋 目次

01 · はじめに

2026年6月時点で、AIコーディングアシスタントは三つのレーンに分かれています。AI ネイティブ IDE（Cursor）、ターミナル CLI Agent（Claude Code、Antigravity CLI）、GitHub エコシステム統合（Copilot）です。多くのチームが「IDE で日常実装、CLI で大規模リファクタ、クラウド Agent で非同期バッチ」という組み合わせを取りますが、共通の評価軸がないと、能力が重なるサブスクを積み上げてしまいます。

本稿の構成は三つの痛点 → 6月市場スナップショット → 四製品の個別解説 → 比較表と SWE-bench → 八シナリオ決定木 → Mac 隔離5ステップです。無料枠や Token 節約には 2026 無料 AI コーディング Token ガイドを、OpenRouter 経由の CLI 選定には CLI ツール Top 10を併読すると、請求データから主力ツールを逆算しやすくなります。

02 · 選定の三つの痛点

1. SWE-bench の数字を「日常の体感」に直結させる。 Claude Code Opus 4.7 は SWE-bench Verified で 87.6%、Gemini 3.1 Pro は 80.6%、Cursor Composer 2.5 Multilingual は 73.7%、Copilot Agent は約 56% です。ただしベンチマークは固定リポジトリの修復課題であり、レガシー単体リポジトリでの成功率とは一致しません。高スコア製品は高価で遅いことも多く、シナリオ別ルーティングが必要です。

2. 2026年の課金モデル変革を軽視する。 GitHub Copilot は 2026年6月1日からクレジット課金へ全面移行しました。1 Credit = $0.01、Pro は $10/月で 1500 Credits を含みます。Cursor Team Standard は 7月1日から $40/ユーザーに値上げされます。月額サブスクが「無制限 Agent」を意味しなくなったため、タスクあたりの Token 消費から実コストを見積もる必要があります。

3. 本番 Mac に IDE と複数 CLI を混在インストールする。 Cursor、Claude Code、Copilot CLI は shell 環境、~/.config、Keychain に書き込みます。設定ミスで本番 API キーがテスト用 cron に入る事故は珍しくありません。捨てられるレンタル macOSで並行試行する方が安全です。手順の考え方は Agent Skill 隔離ガイドや無料 Token 記事の5ステップと同型です。

03 · 2026年6月の市場像

ツールスタック設計に直結する三つのトレンドがあります。

IDE とターミナルの分業： 日常コーディング、複数ファイル diff、Tab 補完は Cursor など AI IDE に集約。長時間推論、Sub-agent 編成、無人 CI は Claude Code など CLI 側が得意です。デュアルスタックが標準になりつつあります。
クレジット課金の普及： Copilot が 1 Credit = $0.01 を先行導入。Cursor と Claude はサブスク＋枠制が中心ですが、従量課金化の流れは明確です。チームには「タスク → Credit／Token 換算表」が必要です。
クラウド非同期 Agent の台頭： Cursor Background Agent、Copilot Workspace、Gemini クラウドサンドボックスは「タスク投入 → 非同期完了 → PR 返却」型です。リアルタイム性よりバッチ向きで、ローカル CLI とは UX が異なります。

ハードな数字： Cursor の DAU は 100万超、ARR は $10億超。Copilot は Fortune 100 の 90%、購読 470万超。Claude Code の GitHub Stars は 11万超。Gemini CLI の個人 OAuth は 6月18日で終了し、Go 製 Antigravity CLI へ移行します。四社とも6月に料金・課金を変更しており、選定の猶予は短いです。

04 · Cursor 詳解

Cursor は VS Code 系のAI ネイティブ IDEで、Agent・Composer・Tab 補完・複数ファイル編集をエディタ内に統合しています。2026年6月の指標は DAU 100万+、ARR $10億+。自社モデル Composer 2.5 は SWE-bench Multilingual で 73.7% を記録し、多言語リポジトリ修復に強みがあります。

料金： Pro は $20/月（高速 Agent 枠＋実質無制限 Tab、詳細は公式参照）。Team Standard は 2026年7月1日から $40/ユーザー/月です。メイン IDE を Cursor に固定し、難問推論だけ Claude Code に逃がすデュアルスタックユーザーに向いています。

強み： IDE 内コンテキスト把握、Composer の複数ファイル編集、Background Agent による非同期処理。弱み： 純ターミナルワークフローや Headless CI では CLI ネイティブツールに劣る場合があります。重度推論の単価は Claude Max と実測比較が必要です。

                        # Cursor CLI のインストール（スクリプト化・リモート向け）

                        curl -fsSL https://cursor.com/install.sh | sh

                        # IDE ダウンロード後にターミナル連携を有効化

                        cursor --version

05 · Claude Code 詳解

Claude Code は Anthropic のターミナルネイティブ CLI Agentで、GitHub Stars は 11万超。コアモデル Opus 4.7 は SWE-bench Verified で 87.6% と2026年6月公開ベンチの最上位クラスです。100万 Token コンテキストに対応し、巨大モノリスや長文仕様の推論に適しています。

料金： Claude Pro $20/月に CLI 利用枠が含まれます。Max 5x $100/月は毎日数時間 Agent を回すヘビーユーザー向けです。恒常的な無料層はなく、予算が厳しい場合は Pro で試行してから Max を検討するのが現実的です。

強み： CLI 陣営で推論深度とツール呼び出しの安定性が際立ちます。macOS Seatbelt サンドボックス、Sub-agent 編成、git/gh/テスト連携が自然です。弱み： IDE 級の Tab 補完やビジュアル diff はありません。日常の「書きながら補完」は Cursor の方が滑らかです。

                        # Claude Code CLI のインストール

                        npm install -g @anthropic-ai/claude-code

                        # プロジェクトディレクトリで Agent 起動

                        claude

06 · GitHub Copilot 詳解

GitHub Copilot は Fortune 100 の 90%、購読 470万超という規模で、企業コンプライアンスと GitHub PR／Issue／Actions 統合のデフォルト候補です。2026年6月の最大の変化は 6月1日からのクレジット課金です。1 Credit = $0.01、Pro $10/月で 1500 Credits（$15 相当）を含みます。Agent モードの SWE-bench は約 56% で、「ベンチ首位」よりエコシステムとコスパを重視するポジションです。

強み： GitHub ワークフローとの一体感、SSO・監査・ポリシー管理の成熟度、Pro 単価の低さ。弱み： Agent 推論は Claude Code に劣る場面があります。長コンテキストでの Credit 消費は不透明なため、初月にベースラインを取る必要があります。

                        # GitHub Copilot CLI のインストール

                        npm install -g @github/copilot

                        # GitHub CLI 拡張経由も可能

                        gh extension install github/gh-copilot

                        gh copilot suggest "explain this function"

07 · Gemini／Antigravity CLI

Google は2026年6月に開発者向け Gemini チャネルを大きく変更します。Gemini CLI の個人 OAuth は6月18日で終了し、個人・Pro／Ultra ユーザーはクローズドソースの Antigravity CLI（Go 実装）へ移行します。コアモデル Gemini 3.1 Pro の SWE-bench は約 80.6% で、Claude Code と Cursor Composer の間に位置します。マルチモーダルと長コンテキストが差別化要因です。

選定メモ： OAuth 無料枠（1000回/日）を使っている場合は、6月18日までに並行試行とスクリプト移行を完了してください。移行パスとオープンソース信頼問題は Gemini CLI 政策解説を参照ください。Google モデル依存を短期試行に留め、長期は IDE＋CLI デュアルスタックでベンダーリスクを分散するのが堅実です。

08 · 横断比較表

2026年6月時点の四製品を一覧化しました。無料層と BYOK は Token ガイドをご覧ください。

観点	Cursor	Claude Code	GitHub Copilot	Gemini／Antigravity
形態	AI IDE + CLI	ターミナル CLI Agent	IDE 拡張 + CLI + Agent	CLI（Antigravity が Gemini CLI を置換）
コアモデル	Composer 2.5 など	Opus 4.7	GPT-4 系／Copilot モデル	Gemini 3.1 Pro
SWE-bench	Multilingual 73.7%	Verified 87.6%	Agent ~56%	80.6%
コンテキスト	プロジェクト索引＋ウィンドウ	1M Token	リポジトリ単位（モデル依存）	長コンテキスト＋マルチモーダル
エントリー料金	Pro $20/月	Pro $20/月	Pro $10/月	Google プラン次第
ヘビー料金	Team $40/ユーザー（7/1〜）	Max 5x $100/月	Business／Enterprise	Pro／Ultra サブスク
課金モデル	サブスク＋枠	サブスク＋枠	Credit（1=$0.01）	サブスク＋API
規模指標	DAU 1M+、ARR $1B+	Stars 110k+	Subs 4.7M+、F100 90%	CLI 6/18 終了・移行
最適シナリオ	日常 IDE 実装、複数ファイル編集	深度推論、巨大リポ、CI Agent	GitHub 統合、企業コンプライアンス	マルチモーダル、Google クラウド

デュアルスタックの目安： 独立開発者の多くは Cursor Pro（$20）+ Claude Code Pro（$20）で月 約 $40。Cursor が日常 IDE、Claude Code が難問リファクタとテスト修復を担当します。Copilot Pro（$10）は GitHub 専用フローの第三候補として有効です。

09 · SWE-bench 順位

SWE-bench は実 GitHub Issue 修復を題材にした業界標準ベンチマークです。2026年6月の公開値（サブセットが異なるため絶対比較は不可、ティア判断は可能）：

順位	製品／モデル	サブセット	スコア	メモ
1	Claude Code · Opus 4.7	Verified	87.6%	CLI 推論の基準
2	Gemini 3.1 Pro	標準セット	80.6%	Antigravity バックエンド
3	Cursor · Composer 2.5	Multilingual	73.7%	多言語リポ向け
4	GitHub Copilot Agent	Agent モード	~56%	コスパとエコシステム

スコアが高いからといって自社プロジェクトで同率になるとは限りません。レガシー慣習、社内フレームワーク、テスト不足は成功率を大きく下げます。隔離環境で自チームの実 Issue サンプルを再検証することをおすすめします。

10 · 八シナリオ＋決定木

典型的な開発シナリオごとに第一候補と代替を示します。

日常機能開発＋Tab 補完： 第一候補 Cursor。代替 Copilot（GitHub 深度利用チーム）。
巨大モノリスリファクタ： 第一候補 Claude Code（1M コンテキスト）。代替 Gemini 3.1 Pro。
PR レビュー＋Issue 自動修復： 第一候補 Copilot + GitHub Actions。代替 Cursor Background Agent。
Headless CI／無人 Agent： 第一候補 Claude Code。代替 Copilot Agent（Credit 消費に注意）。
多言語／越境コードベース： 第一候補 Cursor Composer 2.5。代替 Claude Code。
企業コンプライアンス＋SSO 監査： 第一候補 Copilot Business／Enterprise。代替 Cursor Team。
予算重視の個人： Copilot Pro $10 + 無料層 BYOK（Token ガイド参照）。
マルチモーダル（スクショ／デザイン→コード）： 第一候補 Gemini 3.1 Pro。代替 Cursor のマルチモーダル機能。

選定開始
├─ メインは IDE 日常実装？ → はい → Cursor Pro
│ └─ GitHub 深度統合も必要？ → Copilot Pro を追加
├─ メインはターミナル／CI Agent？ → はい → Claude Code Pro
│ └─ 日次利用が極大？ → Max 5x $100 を検討
├─ Google モデル／マルチモーダル必須？ → Antigravity CLI（6/18 前に移行）
├─ コンプライアンス最優先？ → Copilot Business
└─ 予算 < $15/月？ → Copilot Pro + 国内 API BYOK

11 · Mac 隔離試行5ステップ（HowTo）

隔離 macOS をレンタル： Mac mini M4 から、SSH 接続。ローカルユーザー・Apple ID・OAuth を本番 Mac と完全分離。料金は M シリーズ算力料金を参照ください。
候補ツールを並行インストール： 同一ノードに Cursor、npm install -g @anthropic-ai/claude-code、gh copilot を本番と同バージョンで配置します。
固定ベンチマークパックを実行： 実 Issue が3件ある git リポジトリで、四ツールそれぞれに「読解 → テスト修正 → PR 作成」を走らせ、所要時間と成功率を記録します。
課金軸を照合： Copilot Credit 消費、Cursor／Claude 枠残量、平均レイテンシ、サンドボックス誤検知率を記録し、デュアルスタック $40/月が日次利用を賄えるか見積もります。
ADR を書いて環境返却： 選定結果をチーム文書化し、テストキー失効・OAuth ログアウト・退租ワイプを実施。接続手順は日次レンタル Mac FAQをご覧ください。

12 · よくある質問

Q：Cursor と Claude Code はどちらか一方ですか？ いいえ。2026年の主流はデュアルスタックです。Cursor が IDE 日常（$20）、Claude Code が難問 Agent（$20）で合計約 $40/月。重複より補完関係が強いです。

Q：Copilot の 1500 Credits/月は足りますか？ 軽い補完とたまの Agent なら多くの場合十分です。毎日長コンテキスト Agent を回すと月中に枯渇する可能性があります。初月にタスク種別ごとの消費ベースラインを取ることをおすすめします。

Q：Gemini CLI 終了後は？ 6月18日までに Antigravity CLI へ移行試行を完了してください。OAuth 無料枠依存の場合は国内 API BYOK や Copilot 無料層も併せて計画し、政策解説と Token ガイドを参照ください。

Q：SWE-bench 1位だから Claude Max 必須ですか？ 必ずしもそうではありません。Max $100/月は毎日数時間 Agent を回す人向けです。週次の深度タスクだけなら Pro $20 で足りることも多いです。隔離試行後に判断してください。

Q：10人チームの配分は？ コア2–3名に Claude Code Max、全員に Cursor Team（7/1 値上げ注意）、GitHub コンプライアンス用に Copilot Business——という配分が出発点です。CLI ヘビーユーザー比率で調整します。

13 · まとめ：本番 Mac に四つの AI CLI を混在させない

Windows WSL や Linux ノートに Cursor・Claude Code・Copilot CLI を入れることは可能ですが、本番 Mac に OAuth・本番 API キー・複数 CLI のグローバル設定を同居させると、Copilot Credit や Claude 枠がバックグラウンド cron に焼ける事故が起きやすくなります。WSL のファイルシステムは macOS ネイティブの Seatbelt サンドボックス体験と同等ではなく、Xcode 署名と同周期の検証も難しいです。四製品を並行試行すると、Keychain 衝突、git credential の取り違え、~/.config の上書きが頻発します。

監査可能な「Cursor vs Claude Code vs Copilot vs Gemini の同一リポジトリ対照実測」が必要で、Xcode／Apple ツールチェーンと同じ週に作業するなら、独立した macOS レンタルノードで1–3日試行してからデュアルスタックを固定する方が、衝動的なサブスク積み上げより軽く、本番環境汚染より安全です。Apple Silicon のユニファイドメモリは長時間 Agent でも静かで効率的に動作します。