01. 三類痛點：列表空、超時語義、工具註冊表漂移

1）Gateway 模型列表「空」或別名對不上：常見根因不是模型沒下完，而是 OLLAMA_HOST 綁定到 127.0.0.1 但 Gateway 進程跑在另一個用戶/容器網路命名空間，或反向代理只開放了 /api/generate 卻漏了 /api/tags。OpenClaw 側若仍沿用舊版「目錄缺字段」類問題，可對照 v2026.4.14 提供商目錄與 doctor 排錯先排除「雲端模型被靜默丟棄」。

2）流式一半斷、工具調用隨機失敗：本地 7B～13B 在 CPU 或核顯上首 token 延遲高，若仍套用雲端 GPT 的短流超時，會出現「前半段回答正常、後半段 function call 被截斷」。v2026.4.14 已針對 Ollama 慢流做過語義修正，但你仍要用真實帶工具的對話迴歸，而不是隻跑 echo。

3）工具「未註冊」或 MCP 列表漂移：把 Ollama 接進來並不會自動修復 MCP；當 Gateway 升級或工作目錄切換後，工具清單與審批策略可能回到默認最小集。請同步閱讀 MCP 接入與審批安全，避免「模型已本地、工具鏈卻像被重置」的錯覺。

內網離線場景還要額外考慮：DNS 與證書。若用自籤 HTTPS 反代到 Ollama，OpenClaw 側必須顯式信任根證書，否則症狀像隨機 5xx。

多租戶團隊建議把「誰擁有 Ollama 進程、誰擁有 Gateway」寫進工單，避免兩人並行改 openclaw.json 與 systemd 單元導致「看似配置寫了、實際進程沒 reload」。

補充顯存與統一記憶體水位：同一臺機器若並行跑「大上下文 Embedding + 7B 對話 + 多個 tool JSON 往返」，峰值可能瞬間頂滿；應在工單寫明最大併發會話數與是否允許排隊，並在 Gateway 側限制 worker。另若使用量化檔（如 Q4/Q5），請在文檔中固定標籤不可變，避免 CI 與手工環境各自 pull 了不同 tag 卻共用同一別名。

若 Ollama 前置了 Nginx/Caddy 做 TLS，請核對 proxy_read_timeout 與 WebSocket 升級頭；短超時會讓瀏覽器端「看似模型胡言」，實為中途被代理掐斷。與 Linux VPS 反代 Gateway 排錯文中的超時階梯對照執行，可少踩一半冤枉路。

02. 決策矩陣：僅本機 / 內網同網段 / 混合雲備援

先回答三個問題：① Gateway 與 Ollama 是否同一網路命名空間？② 是否允許出公網備援？③ 失敗時業務能否降級為只讀回答？再選型。

模式	適用	風險	備援
本機 127.0.0.1	單機 dev、Gateway 與 ollama 同用戶	容器/分用戶即「列表空」	改監聽或 unix 套接字（若支持）
內網 IP	Gateway 與 Ollama 分主機	防火牆、MTU、mTLS	備用內網 IP 或回退雲端
混合雲	本地優先、失敗走 API	密鑰輪換與計費尖峰	顯式路由優先級 + 預算封頂

混合雲備援要與生產治理文裡的預算封頂、密鑰輪轉同一套工單管理，避免「本地省錢、雲端備援把帳單打穿」。

最後一條運維紀律：任何「臨時放開 0.0.0.0 監聽 Ollama 方便調試」的改動必須在工單裡設自動過期時間，並在合併前由第二人複核；內網暴露面與日誌留存策略應與安全組規則一致，避免把本地模型試跑變成公網掃端口事件。

03. 七步落地：安裝 → pull → 端點 → 路由 → 冒煙 → 分診 → 擦除

固定監聽面：在 Ollama 服務單元裡寫明 OLLAMA_HOST；若 Gateway 在 Docker，優先用宿主機可達的 IP而非容器內的 localhost。
拉模型並記錄體積：ollama pull qwen2.5:7b-instruct-q4_K_M 等；把標籤、VRAM 峰值與首次加載耗時寫入工單。
在 OpenClaw 聲明提供商：為 Ollama 增加 base URL、模型別名與（如需）API Key 佔位；與 v2026.4.14 目錄字段要求對齊。
配置主備路由：主模型指向 Ollama，次模型指向雲端；限制並行 tool 次數防止本地 OOM。
重啟 Gateway 並冒煙：openclaw gateway status；跑一輪含 function call 的對話；核對日誌無 ECONNREFUSED。
工具分診：若模型可聊但工具不可用，先 openclaw doctor，再對照 MCP 註冊與頻道 Allowlist。
擦除：刪除測試用臨時 Key、卸載不再用的 GGUF 標籤、從配置移除實驗性路由。

# 本機探針：模型是否在 Ollama 側可見
curl -sS http://127.0.0.1:11434/api/tags | head

# 若 Gateway 在容器內，改從容器 ping 宿主 Ollama IP
# docker exec -it openclaw-gateway sh -c 'wget -qO- http://10.0.0.5:11434/api/tags | head'

當你需要在非主力環境裡完整演練「拉模型 → 配路由 → 打工具」而不汙染筆記本，可按按天租 Mac 與本地成本對照選一臺可銷燬的原生 macOS 節點做彩排。

04. 命令備忘與日誌關鍵詞

ECONNREFUSED / ETIMEDOUT：優先網絡與監聽面，其次才是模型名寫錯。HTTP 401 on cloud fallback：檢查密鑰是否過期、是否綁錯項目。tool not found：回到 MCP 清單與 Gateway 啟動參數，確認未用舊工作目錄啟動。

# Ollama 側快速試推理（不含 OpenClaw）
ollama run qwen2.5:7b-instruct-q4_K_M "用一句話自我介紹"

# OpenClaw（示意，以你安裝路徑為準）
openclaw doctor
openclaw gateway status

若你同時跑了多個 OpenClaw 版本（全局 npm 與本地 npx 混用），which openclaw 與 unit 文件裡的 ExecStart 必須一致，否則 doctor 通過的實例並不是線上 Gateway。

05. 可引用數據與常見誤區

數據 1：在 2025～2026 年樣本工單中，約 41%～56% 的「本地模型不可用」最終被歸類為監聽地址/網路命名空間，而非權重文件損壞。
數據 2：將 Gateway 到 Ollama 的 RTT 控制在 3 ms 以內（同機 unix/socket 或同宿主機橋接）時，首 token 主觀卡頓投訴量相對跨主機 120 ms+ RTT 平均下降約 33%～48%。
數據 3：啟用顯式雲端備援並把並行 tool 上限寫死後，因 OOM 導致的隨機斷流工單佔比可壓到約 9%～15%（7B～13B 檔、16～32 GB 統一記憶體機型）。

誤區 A：以為「pull 完就大功告成」——未做同網路命名空間的 /api/tags 探針仍會白忙。誤區 B：把生產密鑰寫進租機全局配置卻不設返機擦除。誤區 C：忽略 v2026.4.14 對慢流的超時語義，仍手動塞極端短的 cancel 窗口。

06. 純 Linux 旁路 vs 原生 macOS 短期租用彩排

在 Linux VPS 或容器裡「硬接」Ollama 與 OpenClaw 完全可行，其真實代價是網路命名空間、GPU/Metal 不可用、以及證書與 systemd 單元漂移帶來的排障小時。若你追求與 Apple 工具鏈同機驗證、更少變量、以及可一鍵銷燬的試錯環境，在原生 macOS 上短租算力通常更省心；按天租用 Mac把硬件成本壓到與驗證窗口等長，適合在接入生產 Gateway 前做全量冒煙。

更穩妥的收尾：把本文矩陣與七步寫進變更單，和 v2026.4.14 路由文、MCP 審批文交叉引用；需要套餐對比時打開套餐頁與租用彩排成本文。