ニューラル抽象画がローカルLLMとOpenClaw Gatewayルーティングを象徴

2026 OpenClawとOllamaローカルモデル:
モデル取得、Gatewayルーティング、オフラインLANと「モデル不可/ツール異常」切り分け表

APIコストを抑えつつGatewayとツールチェーンを維持したい自己ホスト担当者は、しばしばOllamaは動くのにGatewayのモデル一覧が空、ストリームが途中で切れる、ツールが突然未登録の三点で足止めになります。本稿は誰がローカル/LAN/ハイブリッドに向くか、得られるもの(監査可能なルーティング、上限付きクラウド退避、再現性のある切り分け)、構成(痛み三分類、意思決定表、七ステップ、コマンド観測、三つの指標、ネイティブmacOSでのリハーサル比較)を整理し、v2026.4.14プロバイダカタログとdoctorMCP統合と承認日割りMacとローカル費用の比較Linuxリバースプロキシのタイムアウト切り分けへ導きます。

01. 三つの痛み:空カタログ、タイムアウト意味論、MCPレジストリのズレ

1)Gatewayのモデル一覧が空:多くの場合、破損したGGUFではなく、OLLAMA_HOST127.0.0.1のままGatewayが別ユーザー/別コンテナネットワーク名前空間にある、あるいはリバースプロキシが/api/generateだけを公開して/api/tagsを忘れていることが原因です。OpenClaw側でカタログ行が静かに落ちるケースはv2026.4.14のランブックから先に潰してください。

2)ストリームがツール直前で途切れる:CPUや統合GPU上の7B〜13Bでは初回トークン遅延が大きく、クラウドGPT向けの極端に短いキャンセル窓を流用するとJSONツール呼び出しの直前で切断されます。v2026.4.14で遅いストリーム向けの意味論は改善済みですが、echoではなく実際のツール往復で回帰してください。

3)ツール未登録:Ollamaを繋いでもMCPのドリフトは自動修復されません。Gateway更新や作業ディレクトリ変更で許可リストが最小集合に戻ることがあります。MCP承認ガイドを並行して読んでください。

オフラインLANではDNSと証明書が罠になります。プライベートCAでTLS終端する場合、OpenClawがルートを明示的に信頼しないとランダムな5xxに見えます。

マルチテナント運用では「誰がOllamaを再起動し、誰がGatewayをreloadするか」をチケットに明記し、openclaw.jsonとsystemdユニットを二人で同時編集しないでください。

VRAMとユニファイドメモリの水位も文書化してください。大きな文脈の埋め込み、7Bチャット、複数のtool JSONが同時に走るとピークが跳ね上がります。最大同時セッション数と待ち行列の可否を決め、Gatewayワーカーで上限を掛けます。

NginxやCaddyの前段ではproxy_read_timeoutとWebSocketアップグレードを点検してください。短いタイムアウトは「モデルが幻覚」と誤認させます。Linux VPSの逆プロキシ切り分け記事のタイムアウト段階と突き合わせてください。

量子化タグはドキュメントで固定し、CIと手元で別digestをlatestに解決しないようにします。

オブザーバビリティでは429本体とGatewayログの相関から、プロバイダ絞りとローカルスーパーバイザ問題を分離します。

小さなVPSではinode枯渇でログが静かに切れます。デバッグ出力を増やすときはGB空きとinodeの両方を見ます。

複数エンジニアが同一ホストを共有する場合、doctor --repair系操作は直列化します。同一ユニットファイルへの並行書き込みは一時的な半壊に見えます。

企業AVがNodeモジュール解決に遅延を挿入するとOpenClaw退行に見えることがあります。アップグレード前にsyscallベースラインを取ります。

Git同期設定は明示的なリビジョンで直列化します。ブート時自動pullと同時アップグレードはJSON半壊を招きます。

前四半期は余裕だったcgroupメモリ上限が、更新後のNodeヒープではOOMを誘発することがあります。JavaScriptスタックの横にOOMキラーを探します。

デバッグで0.0.0.0に一時バインドする場合はチケットに失効時刻と第二レビューを必須にし、ポートスキャン騒動を避けます。

CLIと常駐Gatewayの版ズレは別チケット行で管理します。新しいCLIでdoctorを通しても、unitが古い作業ディレクトリを指していれば挙動は古いままです。ログのビルドハッシュと設定ファイルのチェックサムを同じコメントに揃えます。

埋め込みワークロードを容量計画の一次市民として扱います。チャット用VRAMだけ見積もり、後からローカル埋め込みを足すとGatewayタイムアウト前提が崩れます。

02. 配置マトリクス:localhost/LAN/ハイブリッド

三問に答えてから列を選びます。GatewayとOllamaは同じネットワーク名前空間か。サイト外の課金APIに出してよいか。失敗時に読み取り専用回答へ劣化できるか。

モード 向く場面 リスク 退避
127.0.0.1単一ユーザー開発、同一アカウントコンテナ/ユーザー分離で一覧空到達可能LAN IPやunixソケット
プライベートLANホスト分離構成FW、MTU、mTLS予備LANまたは明示クラウド
ハイブリッドローカル優先+キュー溢れ時APIキー輪転と請求スパイク優先順位と予算上限のハードコード

ハイブリッドは本番ガバナンスと同じ変更管理に載せ、週末のクラウド破綻を防ぎます。

本番昇格時は優先順位と、ローカル経路が健全であることを示す指標をチケットに残します。

03. 七ステップ

  1. リスン面の固定:サービスユニットでOLLAMA_HOST。Docker内Gatewayならコンテナlocalhostではなくホスト到達IP。
  2. pullと記録:ollama pull qwen2.5:7b-instruct-q4_K_Mなど。VRAMピークとコールドスタート秒をチケットへ。
  3. プロバイダ宣言:ベースURLと別名。v2026.4.14のカタログ項目に合わせる。
  4. 主/副ルート:主はOllama、副はクラウド。並列tool上限でOOM回避。
  5. 再起動とスモーク:openclaw gateway status、ストリーム、function call一発。
  6. ツール切り分け:openclaw doctor後にMCP登録とチャネル許可を照合。
  7. 消去:テスト鍵、不要GGUFタグ、実験ルートを撤去。
curl -sS http://127.0.0.1:11434/api/tags | head
# docker exec 内からホストIPへ置換

ノートPCを汚さず本番同等のリハーサルには日割りMacの費用比較で捨て可能なネイティブmacOSを選びます。

04. コマンドとログ手掛かり

ECONNREFUSED/ETIMEDOUTはモデル名より先にネットワーク。401はクラウド鍵。tool not foundはMCPと起動cwd。

ollama run qwen2.5:7b-instruct-q4_K_M "一文で自己紹介"
openclaw doctor
openclaw gateway status

グローバルnpmとローカルnpx混在ではwhich openclawExecStartの一致を確認します。

curl段階はtags→短いgenerate→ツール付きの三段にします。

05. 指標と誤解

  • 指標1:2025〜2026の社内チケットで「ローカル不可」の41〜56%リスン/名前空間に分類。
  • 指標2:Gateway-Ollama RTTを約3ms未満に抑えると、120ms+跨ぎホスト比で主観的初回トークン不満が約33〜48%減。
  • 指標3:明示クラウド退避と並列tool上限後、16〜32GB級でOOM断流は約9〜15%まで低下。

誤解A:pull完了即本番。誤解B:レンタルに本番鍵を書いて返却手順なし。誤解C:v2026.4.14の遅流対策を無視した極短キャンセル。

06. Linux迂回とmacOSリハーサル

Linux VPSやコンテナでの同居は可能ですが、名前空間と証明書とsystemdドリフトの工数が実コストです。Xcodeや公証フローと同じ机上で検証したいチームにはネイティブmacOSが変数を減らします。

Linux完結は短期検証や予算制約により適し、四半期以上の所有にはメンテ面が膨らみがちです。

MetalやAppleツールチェーンを活かしつつ、失敗しても捨てられるノードが欲しい場合は日割りMacで検証ウィンドウに合わせた固定費化が現実的です。

まとめにv2026.4.14MCP承認を相互リンクし、段階は料金案内日割り比較で確認してください。