2026 年 CoreWeave 為何成為 AI 算力租賃最大明星
Q1 積壓 994 億美元、H100/H200 按小時真帳本
與 GPU 訓練池 vs Apple Silicon 編譯池對照表

資本市場稱它 The Essential Cloud for AI,Microsoft、Meta、OpenAI、Anthropic、Jane Street 排隊簽約。本篇拆解 Q1 2026 真帳本、客戶集中度、NVIDIA 三位一體、HGX 按小時定價,以及為何 iOS 簽署、送審、公證、OpenClaw 隔離仍應留在實體 Mac 而非塞進 GPU 雲。

CoreWeave 2026 AI 算力租賃

2026 年 5 月 7 日,CoreWeave(Nasdaq:CRWV)公布首份完整年度第一季財報:營收 2.08B 美元、年增超過 100%,積壓訂單高達 99.4B 美元,在線算力 1 GW,並宣示 2030 年衝上 8 GW。執行長 Michael Intrator 把公司定位為「The Essential Cloud for AI」——說白話就是把 NVIDIA 最新世代 GPU 拆成按小時零售。本篇回答三件事:賺到誰的錢、收益結構長什麼樣、為何訓練該上 CoreWeave 但 iOS 簽署公證仍應留在 Mac。

01 為何資本市場稱它 AI 算力租賃最大明星

2024 年中以前,CoreWeave 在主流投資圈還只是「一家從礦工轉型的 GPU 雲」。短短一年半,它變成 Microsoft、Meta、OpenAI、Anthropic、Jane Street、Cohere、Mistral、Perplexity、Hudson River Trading 同時排隊簽長約的對象。理由不複雜:當每一家想做前沿模型的公司都缺 H100 與 H200,唯有真正握有 NVIDIA 直供配額、又能把資料中心電力與機櫃做到 GW 等級的玩家,才稱得上算力「批發商」。

CoreWeave 是介於 NVIDIA 與其它雲(甚至 Hyperscaler)之間的「強制中間層」:NVIDIA 把首批 GB200 NVL72 推論認證授予 CoreWeave Exemplar Cloud;Microsoft 把外溢的 OpenAI 訓練負載交給它;OpenAI、Anthropic 直接簽多年合約鎖住未來容量。資本市場給的標籤「The Essential Cloud for AI」並非自誇,而是供給端集中度的結構性結果。

02 Q1 2026 真帳本:2.08B 營收、99.4B 積壓、1 GW 邁向 8 GW

本季營收 2.08B 美元,超過分析師預期的 1.97B;去年同期僅 981.8M,年增逾倍。但帳面同步寫下淨虧損 740M 美元(去年同期 315M),調整後每股虧損 1.12 美元,較市場預期的 -0.90 更深。在線算力 1 GW,已簽約功率超過 3.5 GW(本季新增 400 MW 以上),10 家客戶年支出皆在 10 億美元以上。Q2 指引 2.45–2.6B(中點低於 LSEG 預期 2.69B),全年 12–13B。

對潛在使用者而言,這份財報暴露三個必須正視的痛點:

  1. 痛點 1:算力價格仍然偏貴——HGX H100 按需 49.24 美元/小時,意味著一張 8 卡節點月開銷上看 28 萬美元;中小團隊要先想清楚 LoRA、QLoRA、蒸餾能否取代全量訓練。
  2. 痛點 2:合約最低承諾與積壓綁定——積壓訂單 99.4B 多半附 take-or-pay 條款。簽下去就等於把未來三到六年的算力預算寫死,與 SaaS 訂閱可隨時退訂完全是兩個世界。
  3. 痛點 3:密鑰與資料合規邊界——共用控制平面意味著 IAM、私鑰、模型權重必須走 SecretRef 與 KMS 雙層隔離,否則一個 token 外洩就會把多個專案捲入同個爆炸半徑。

03 客戶結構:Microsoft 占六成到十億俱樂部

客戶集中度高得驚人。Microsoft 在 2024 年貢獻 62% 營收,2025 年約 67%。Meta 在原本 14.2B(合約期至 2031-12)的基礎上,於 2026 年 3 月再加簽 21B,總金額拉到約 35.2B 美元、覆蓋至 2032-12。OpenAI 三筆合計可達 22.4B:2025-03 首筆 11.9B、2025-05 加 4B、2025-09 再加 6.5B。Anthropic 於 2026-04 簽下多年合約支援 Claude 訓練與推論,下半年算力會陸續上線。Jane Street 在 2026-04 簽下 6B 美元 AI 雲合約,把量化交易也納入 CoreWeave 池子。

另有 Cohere、Mistral、Perplexity、Hudson River Trading、Adaption Labs、Advaita Bio、World Labs 等名單。重點是「10 家年支出破 10 億美元」這條敘事——當頂級客戶集體押注同一供應商,議價權自我強化。

04 NVIDIA 三位一體:2B 持股、Exemplar Cloud、Rubin 早採

2026-01-26,NVIDIA 公告以每股 87.20 美元注資 2B 美元 Class A 股權,正式成為 CoreWeave 戰略股東。三件事同時發生:第一,CoreWeave 成為首批導入 NVIDIA Rubin 平台、Vera CPU 與 BlueField 智能儲存的雲端營運商;第二,CoreWeave Exemplar Cloud 拿到首批 GB200 NVL72 推論認證,等於 NVIDIA 官方蓋章「跑 Blackwell 認這家」;第三,雙方共建 5 GW 以上 AI 工廠目標 2030 完成。再加上 NVIDIA 早先簽下的 6.3B take-or-pay 容量備援至 2032-04,這是教科書級「合資人、認證者、客戶」三位一體。

05 算力如何計價:H100 / H200 / GB200 按小時對照表

CoreWeave 2026 標價已公開上架,0 ingress / 0 egress / 0 transfer 費。對開發者而言,最該記住的就是這張表:HGX 8 卡節點按需與 Spot、加上 Inference 單卡,是大部分團隊真正會付的價位;GH200、GB200、GB300 則保留聯絡業務的 enterprise 報價。

GPU 型號 On-Demand ($/h) Spot ($/h) Inference Single ($/h) 備註
HGX H10049.2419.716.168 卡節點,主力訓練
HGX H20050.4420.936.318 卡節點,記憶體更大
GH200聯絡業務Grace + Hopper Superchip
GB200 / GB300聯絡業務1 CPU + 2 Blackwell Superchip
H100 PCIe (Classic)4.25單卡,傳統機型
A100 80GB (Classic)2.21單卡
A100 40GB (Classic)2.06單卡

06 Q1 新產品:Flex、Spot、Dedicated Inference、Sandboxes、ARENA

Q1 同時推出五項產品,把計費顆粒度全面打開:Flex Reservations 把長約靈活拆段;Spot Pricing 把 H100/H200 砍到約原價四成,但允許中斷;Dedicated Inference 提供按小時的單卡推論池;CoreWeave Sandboxes 是 RL 訓練用的強隔離環境,避免模型彼此污染;CoreWeave ARENA 則為生產前評估,配合 W&B Weave + W&B Models 擴充版做指標追蹤。對中型團隊而言,Spot + Inference Single 的組合最務實——非關鍵任務先吃 19.71/h 的 H100 Spot,正式推論再切到 Dedicated。

07 融資結構:DDTL 4.0 8.5B、DDTL 5.0 3.1B、股權 2B

2026 YTD 募資總額超過 200 億美元債股組合。DDTL 4.0 為 8.5B 非追索投資等級延期提款定期貸款,浮動利率 SOFR+2.25%、固定約 5.9%;DDTL 5.0 為 3.1B 首筆公開聯貸 HPC 抵押 DDTL,定價 SOFR+4.50%。Moody's 給 Ba2,Fitch 給 BB+,仍在投機級邊緣。加上 NVIDIA 2B 股權挹注,CoreWeave 以「資產抵押+戰略投資人+公開聯貸」三條腿撐起 GW 級擴張。但這份資本結構高度依賴積壓兌現,一旦 take-or-pay 被重新談判,浮動利率會反咬一口。

08 風險面:客戶集中度、Q2 指引偏弱、虧損擴大

財報公布後股價單日跌 10%,市場焦慮非常具體:第一,Microsoft 67% 占比意味著任何一次續約節奏錯位都會折半年營收;第二,Q2 指引中點 2.525B 明顯低於 LSEG 預期 2.69B,暗示新容量爬坡比預期慢;第三,淨虧損 740M、調整後 EPS -1.12 都比去年更深,舉債依賴度上升。換算回採購決策:別把所有 GPU 雞蛋放在一個籃子,非關鍵負載保留 Lambda Labs、Crusoe、Hyperscaler、NVIDIA-IREN 5 GW 與 NVIDIA-Corning 等替代池。

09 給開發者的真實含義:訓練 / 微調 / 在線推論 / 邊緣推論 四檔安置

把上面這些數字翻譯回工程語言,其實是一張很乾淨的決策矩陣。「該不該上 CoreWeave」不是二選一,而是按工作負載分成四檔。下表是我們在實戰中歸納的對照——同一個 LLM 專案,可能同時把不同階段塞進不同池子,才能把帳單壓到合理區間。

工作負載 建議落腳 月成本量級 取捨重點
大模型訓練 / 全量微調CoreWeave HGX H100/H200 池數十萬美元起幾乎唯一可行,鎖長約換折扣
LoRA / 蒸餾 / 短訓CoreWeave Spot 19.71/h每月千美元級容忍中斷,配 checkpoint
在線推論Dedicated Inference 6.16/h千至萬美元級關鍵路徑走 Dedicated
邊緣推論 / 小模型 Demo自建 Mac / Jetson一次性硬體延遲最低、零雲費
iOS 簽署 / 送審 / 公證 / OpenClaw 隔離macdate.com 按天租實體 Mac1–3 日成本GPU 雲完全無解

10 並非所有 AI 工作都該上 GPU 雲:iOS / macOS 編譯為何留在 Mac

CoreWeave 解決的是「大規模平行浮點運算」這道題,但 Apple 生態的編譯、簽署、送審、公證鏈條完全是另一條軸。Xcode Archive 必須在 macOS 上跑、Provisioning Profile 與 P12 必須走 keychain、TestFlight 上傳需要 ASC API 與 JWT、macOS 應用程式必須走 notarytool 公證。這些步驟不是「GPU 不夠快」,而是 Apple 從合約面禁止在非授權硬體上跑 macOS。把它們塞進 Linux GPU 雲,等於從零搭建一條走不通的路。

更實務的考量是:許多團隊把 OpenClaw v2026.5.20 之類的 AI 代理放上自己的開發機跑批,但同一台機若同時保管簽署憑證、SSH 私密金鑰、客戶 API key,一次外掛漏洞就可能把整條供應鏈拖下水。隔離環境的成本,遠低於一次帳號封禁或拒審。

11 落地排程:1 至 3 天把短訓放 CoreWeave、把出包放按天租 Mac

給一個真實可複製的節奏。假設你手上有一個下週要交付的 iOS 應用程式,內含一顆需要短時微調的 LLM 模型:

  1. 第 1 步:盤點工作流——把任務拆成「GPU 微調 + 模型量化匯出」與「iOS 編譯 + 簽署 + 公證 + 上傳」兩條獨立路徑。前者帶寬與算力決定速度,後者證書與環境決定能否過審。
  2. 第 2 步:CoreWeave 開短期 Spot 節點——以 H100 Spot 19.71/h 跑 LoRA 微調,目標 24 小時內收斂;checkpoint 每 30 分鐘寫一次,避免被回收造成回頭。預算上限以 CLI 寫死,避免溢出。
  3. 第 3 步:把量化後權重打成 Core ML 套件——透過 coremltools 在容器內完成,再以 0 egress 的優勢直接拉回本地或 S3 兼容物件儲存。
  4. 第 4 步:在 macdate.com 開一台按天租實體 M4 Mac——只租 1–3 日,乾淨環境跑 Xcode Archive、TestFlight 上傳、必要時 notarytool 公證;憑證走 Fastlane Match 唯讀模式,CI/CD 節點選型可參考此指南
  5. 第 5 步:歸還前零殘留清理——刪鑰匙圈、清 DerivedData、撤 Provisioning Profile、清 SSH known_hosts,確保下一位使用者拿到的是完全乾淨的機器。

12 目前方案的限制與更佳選擇

即便 CoreWeave 把訓練端的價格透明化、把 GPU 雲推到了自助下單的門檻,它依舊解決不了 Apple 生態的最後一哩。iOS 與 macOS 的編譯、簽署、Archive、TestFlight、送審、公證、OpenClaw 隔離試跑,每一步都必須跑在真正的 macOS 上、而且最好是一台乾淨、未污染、可隨時歸還的機器。自購 Mac 在這個情境下會發生兩種浪費:硬體 90% 時間閒置、本機長期累積的鑰匙圈與描述檔污染風險越來越高。Xcode Cloud 與 M4 物理集群的對比顯示,1–3 日的短週期需求,按天租實體 Mac 既比自購更便宜、也比共享平台更安全。

延伸閱讀