協作機房與語音會議基礎設施,象徵 OpenClaw Discord 即時語音與 Gateway 驗收

2026 OpenClaw v2026.5.20 完全指南:
Discord 即時語音跟隨、xAI 裝置碼 OAuth 與 Policy 外掛驗收——含按天租用 macOS 隔離試跑排錯清單

當您已自架 OpenClaw Gateway、升到 v2026.5.20 後,文字頻道正常卻「語音跟不進房間」、雲端伺服器上 Grok 登入卡在 localhost 回呼、doctor 又冒出從未見過的 Policy 合規項,這三條線其實是同一版 release 主題——不是模型路由壞了。本文面向開發者與維運:提供三類痛點、語音·鑑權·Policy 決策矩陣、七步落地、分診表、三條可引用數據、1~3 日按天租用 macOS 日程,並內鏈 安裝與部署指南Telegram / Discord 頻道配對v2026.5.12 模組化外掛命令報錯排查SSH/VNC FAQ

01. 三類痛點:語音跟隨失效、無頭 xAI 登入、Policy doctor 新項

1)Discord 文字能回、語音卻像「頻道沒裝好」:v2026.5.20 把即時語音與文字分軌:voice.followUsers 讓 bot 跟隨指定使用者進語音頻道,並帶 allowed-channel 校驗、多使用者 handoff 與 DAVE 恢復。若您只驗收過 文字配對與 Allowlist,會誤以為 Discord 已通——語音合格訊號是使用者進語音 → bot 跟進同一 allowed 頻道 → STT/路由有日誌,不是 channels status 顯示 configured 就夠。

2)雲端伺服器 / SSH 上 xAI OAuth 卡在 localhost:5.20 新增裝置碼流程:Gateway 列印 xAI 驗證 URL 與短碼,操作者在任意瀏覽器完成授權,遠端程序輪詢換 token。仍用 loopback OAuth 卻未做埠轉發時,會呈現「登入命令掛起」——這與 API Key 缺失、模型列表空是不同分診軸,應優先走 openclaw models auth login --provider xai --device-code

3)Policy 外掛讓 doctor 多出合規 / 修復類條目:內建 Policy 外掛對頻道設定做策略級 conformance check、doctor lint,並支援可選 workspace repair。常見誤操作是一見 lint 就在正式環境一鍵修復;Runbook 應在按天租用隔離機先 dry-run,再決定是否 opt-in repair。doctor 也會對 plaintext 金鑰、沙箱隱藏 MCP 工具等發 WARN——與 Policy 混在同一報告裡,不讀章節標題容易誤判 Gateway 故障。

三條線會互相牽動:即時語音預設注入 IDENTITY.mdUSER.mdSOUL.md,人設飄移常是 bootstrap 檔案問題而非模型路由;xAI device-code 讓 Grok 類推理在無頭主機可落地;Policy lint 則告訴您剛對外開放的 follow-users 語音頻道,是否真的符合配對與 Allowlist 敘述。

02. v2026.5.20 決策矩陣:Discord 語音 / xAI / Policy

下表供變更窗口30 秒內可執行的驗收語意使用;右欄證據請在短租 macOS 上脫敏存檔後再擦除機密。

能力面(5.20) 通過訊號 短租 macOS 證據
voice.followUsers 列名使用者進語音後 bot 跟進 allowed 頻道;換房、離線有界 handoff 脫敏語音狀態日誌 + channels status --channel discord JSON
voice.followUsersEnabled 預設 true;設 false 可暫停而不刪 ID 清單 Control UI 語音面板切換截圖
voice.realtime.bootstrapContextFiles 預設注入 IDENTITY/USER/SOUL;子集或 [] 可關閉;AGENTS.md 仍在一般 agent 脈絡 開關前後首輪語音回覆對照(是否「丟人設」)
xAI device-code OAuth models auth login --device-code 完成;模型列表含 xAI;單次推理 smoke 通過 脫敏 auth profile 列表;設定 JSON 無明文金鑰
Policy 外掛 / doctor lint WARN 已修復或附工單豁免;repair 僅在隔離機 opt-in openclaw doctor 修復前後 stdout diff
語音 Allowlist 入口 非 allowlist 成員語音在轉寫前被拒 允許 vs 封鎖測試帳號各探一次

v2026.5.12 模組化外掛 相鄰:5.20 不取代「按需裝 Discord 外掛」,而是在外掛已裝前提下疊語音與 realtime。join 模式請刻意選擇:followUsers 適合值班在 huddle 間移動;autoJoin 適合固定房間助手;/vc join 適合一次性會議——三者混用又不寫優先順序,容易產生「幽靈 bot 空房待機」工單。

bootstrapContextFiles:即時語音脈絡差異

Realtime 回合低延遲、不會自動重播整個 workspace。5.20 預設把小型 profile 檔注入 provider 指令,讓口語回覆對齊路由 agent 人設。若覺得 prompt 過重可改子集;要嚴格中立可設 [] 並接受語音較「通用」。這取代 openclaw_agent_consult 做工具與記憶查詢——只 grounding 身分。

03. 七步落地:升級 → followUsers → bootstrapContext → device-code → Policy → 驗收 → 擦除

  1. 凍結基線:記錄 openclaw --version、Discord 語音區塊、xAI auth profiles、openclaw channels status --json;確認載入的 openclaw.json 路徑與 Gateway 啟動參數。
  2. 備份與升級至 5.20:快照設定與 IDENTITY/USER/SOUL;執行 openclaw update,保存 stdout 與退出碼。GitHub Release 標註 2026-05-21 可作變更稽核錨點。
  3. 設定 voice.followUsers僅列入需跟隨的 Discord 使用者 snowflake(非顯示名稱);核對 guild/channel allowlist;變更後重啟 Gateway
  4. 調 bootstrapContextFiles預設三檔做口語探測;若 token 過大可改子集或 [],並記錄權衡。
  5. 無頭 xAI 授權:在 SSH/VPS 執行 openclaw models auth login --provider xai --device-code;在可信裝置瀏覽器完成驗證;勿把 device code 貼進聊天紀錄。
  6. Policy doctor:openclaw doctor 審閱 Policy conformance;僅在隔離機嘗試 opt-in repair;正式環境只套用已評審 diff。
  7. 交叉驗收與擦除:channels status --probe;語音實測 + xAI smoke;租機刪 OAuth state、示範 bot token 與暫存設定副本。
openclaw --version
openclaw channels status --json 2>&1 | tee /tmp/oc520-ch-before.json
openclaw backup create   # 若環境已啟用

openclaw update
openclaw gateway restart

openclaw models auth login --provider xai --device-code
openclaw doctor 2>&1 | tee /tmp/oc520-doctor.txt
openclaw channels status --probe --channel discord

磁碟剩餘低於 15 GB 時,並行升級、語音 provider 預熱與 doctor repair 易失敗——5.20 亦更新 bundled 依賴,安裝 artifacts 會短暫膨脹。遠端連線頻寬與租用成本見 SSH/VNC FAQ;新裝請對齊 多平台安裝指南 的 Node 24(或 ≥22.19)。

followUsers 設定片段

{
  "channels": {
    "discord": {
      "voice": {
        "enabled": true,
        "followUsers": ["123456789012345678", "discord:987654321098765432"],
        "followUsersEnabled": true,
        "realtime": {
          "bootstrapContextFiles": ["IDENTITY.md", "USER.md", "SOUL.md"]
        }
      }
    }
  }
}

04. 分診表:症狀 → 優先動作 → 誤操作

症狀 優先動作 常見誤操作
使用者進語音,bot 不進房 followUsers snowflake、Connect 權限、allowed-channel 整晚重配文字 Allowlist
語音人設與文字 agent 不一致 檢查 bootstrapContextFiles 與 workspace profile MD 把整份 AGENTS.md 硬塞進語音設定
xAI device-code 逾時 操作者待命重跑;查 VPS 時鐘漂移與出站 HTTPS 在 git 追蹤 JSON 寫入長期 API Key
doctor Policy WARN 過多 依類別分診:金鑰、allowlist、沙箱/MCP;修復或附工單豁免 關閉 doctor 或刪 Policy 外掛
非 allowlist 語音仍被轉寫 收緊 Discord 成員/頻道 allowlist;用封鎖帳號重測 以 bot 已進房為由假設語音公開
DAVE 斷線後 bot 卡住 重試 follow 移動;查 5.20 DAVE 恢復說明;必要時重啟 Gateway 移除 allowlist 強制 join

文字 Discord 正常、語音失敗時請拆問題:OAuth 與 app 註冊共用,但語音另加 realtime provider、follow 狀態機與入口 allowlist。同時改 xAI 授權、改 SOUL.md、又放寬 allowlist,很少能知道哪一步真正修好——請先各存一份 channels status 與短語音日誌切片。工具拒絕可對照 命令報錯大全:5.20 移除舊 SKILL.md cat 兼容,技能須走 read 工具。

05. 三條數據、誤區與 1~3 日按天租用 macOS 日程

  • 數據 1:GitHub v2026.5.202026-05-21 發布,Release Notes 列舉 Discord followUsers、realtime bootstrap、Policy 外掛與 xAI device-code——可作版本對齊憑證。
  • 數據 2:npm tarball integrity sha512-cgshS76CxS3Vp9NGtJR2UGtVZxVR5/4rvok8DKGGL19DugAftNabsXfYajyAEiJ3dC8QTXNqF62MdQNzUnQe8Q== 已公布;在租機釘版可重現客戶 incident。
  • 數據 3:團隊在 M4 按天租用節點上,若 Discord allowlist 文件齊備,常把 followUsers + device-code + Policy lint 壓進單次 3~5 小時;配對債務重時可能延至 1~2 日。

誤區 A:以為 followUsers 可取代 allowlist。誤區 B:在正式環境首次試 Policy repair。誤區 C:bootstrap 過大導致 realtime token 爆頂,卻去降模型能力。

第 1 日:上午凍結 channels 與 auth;下午升級 5.20、存 doctor;傍晚為單一操作者 ID 設定 followUsers 並實測進房。

第 2 日:調 bootstrapContextFiles A/B;在同形狀主機跑 device-code;確認 xAI 推理 smoke。

第 3 日:處理或豁免剩餘 lint;allowlist vs 封鎖語音探針;擦除租機密鑰;輸出 Runbook(語音 ID、bootstrap 選擇、auth profile 順序)。

06. 無頭 Linux 伺服器 vs 按天租 Mac:語音調試與 Control UI

Linux VPS 適合 24/7 Gateway 與 device-code 輪詢——您可在手機瀏覽器完成 OAuth,憑證留在伺服器。但若驗收還要 Discord 語音狀態除錯、Control UI 看語音開關、Keychain 裡的 deploy key,以及邊聽 realtime 邊對照 profile MD,日誌分散在三台機器時,隱性工時常超過短租費用。

CLI 清單大多可在 VPS 完成,正式環境也可能繼續跑 Linux。按天租用 macOS 的價值在彩排保真度:原生環境把 Gateway、Control UI、Discord 桌面放在同一證據鏈,在可拋棄 workspace 上試 Policy repair,又不必把 production OAuth 綁在工程師個人 Discord。容器適合尖峰試錯,較難重現語音延遲與 follow handoff 的操作體驗。

若要在 1~3 天內產出可交接 Runbook、又與團隊主力機解耦,按天租用 Mac通常比「VPS SSH + 手機 OAuth + 臨時聽音」順暢。套餐見 M4 算力價格頁;連線頻寬與成本見 SSH/VNC FAQ