2026 年 CoreWeave 為何成為 AI 算力租賃最大明星
Q1 積壓 994 億美元、H100/H200 按小時真帳本
與 GPU 訓練池 vs Apple Silicon 編譯池對照表
資本市場稱它 The Essential Cloud for AI,Microsoft、Meta、OpenAI、Anthropic、Jane Street 排隊簽約。本篇拆解 Q1 2026 真帳本、客戶集中度、NVIDIA 三位一體、HGX 按小時定價,以及為何 iOS 簽署、送審、公證、OpenClaw 隔離仍應留在實體 Mac 而非塞進 GPU 雲。
2026 年 5 月 7 日,CoreWeave(Nasdaq:CRWV)公布首份完整年度第一季財報:營收 2.08B 美元、年增超過 100%,積壓訂單高達 99.4B 美元,在線算力 1 GW,並宣示 2030 年衝上 8 GW。執行長 Michael Intrator 把公司定位為「The Essential Cloud for AI」——說白話就是把 NVIDIA 最新世代 GPU 拆成按小時零售。本篇回答三件事:賺到誰的錢、收益結構長什麼樣、為何訓練該上 CoreWeave 但 iOS 簽署公證仍應留在 Mac。
本文目錄
- 01 為何資本市場稱它 AI 算力租賃最大明星
- 02 Q1 2026 真帳本:2.08B 營收、99.4B 積壓、1 GW 邁向 8 GW
- 03 客戶結構:Microsoft 占六成到十億俱樂部
- 04 NVIDIA 三位一體:2B 持股、Exemplar Cloud、Rubin 早採
- 05 算力如何計價:H100/H200/GB200 按小時對照表
- 06 Q1 新產品:Flex、Spot、Dedicated Inference、Sandboxes、ARENA
- 07 融資結構:DDTL 4.0 8.5B、DDTL 5.0 3.1B、股權 2B
- 08 風險面:客戶集中度、Q2 指引偏弱、虧損擴大
- 09 給開發者的真實含義:訓練 / 微調 / 推論 / 邊緣四檔安置
- 10 並非所有 AI 工作都該上 GPU 雲:iOS / macOS 編譯為何留在 Mac
- 11 落地排程:1 至 3 天把短訓放 CoreWeave、把出包放按天租 Mac
- 12 目前方案的限制與更佳選擇
01 為何資本市場稱它 AI 算力租賃最大明星
2024 年中以前,CoreWeave 在主流投資圈還只是「一家從礦工轉型的 GPU 雲」。短短一年半,它變成 Microsoft、Meta、OpenAI、Anthropic、Jane Street、Cohere、Mistral、Perplexity、Hudson River Trading 同時排隊簽長約的對象。理由不複雜:當每一家想做前沿模型的公司都缺 H100 與 H200,唯有真正握有 NVIDIA 直供配額、又能把資料中心電力與機櫃做到 GW 等級的玩家,才稱得上算力「批發商」。
CoreWeave 是介於 NVIDIA 與其它雲(甚至 Hyperscaler)之間的「強制中間層」:NVIDIA 把首批 GB200 NVL72 推論認證授予 CoreWeave Exemplar Cloud;Microsoft 把外溢的 OpenAI 訓練負載交給它;OpenAI、Anthropic 直接簽多年合約鎖住未來容量。資本市場給的標籤「The Essential Cloud for AI」並非自誇,而是供給端集中度的結構性結果。
02 Q1 2026 真帳本:2.08B 營收、99.4B 積壓、1 GW 邁向 8 GW
本季營收 2.08B 美元,超過分析師預期的 1.97B;去年同期僅 981.8M,年增逾倍。但帳面同步寫下淨虧損 740M 美元(去年同期 315M),調整後每股虧損 1.12 美元,較市場預期的 -0.90 更深。在線算力 1 GW,已簽約功率超過 3.5 GW(本季新增 400 MW 以上),10 家客戶年支出皆在 10 億美元以上。Q2 指引 2.45–2.6B(中點低於 LSEG 預期 2.69B),全年 12–13B。
對潛在使用者而言,這份財報暴露三個必須正視的痛點:
- 痛點 1:算力價格仍然偏貴——HGX H100 按需 49.24 美元/小時,意味著一張 8 卡節點月開銷上看 28 萬美元;中小團隊要先想清楚 LoRA、QLoRA、蒸餾能否取代全量訓練。
- 痛點 2:合約最低承諾與積壓綁定——積壓訂單 99.4B 多半附 take-or-pay 條款。簽下去就等於把未來三到六年的算力預算寫死,與 SaaS 訂閱可隨時退訂完全是兩個世界。
- 痛點 3:密鑰與資料合規邊界——共用控制平面意味著 IAM、私鑰、模型權重必須走 SecretRef 與 KMS 雙層隔離,否則一個 token 外洩就會把多個專案捲入同個爆炸半徑。
03 客戶結構:Microsoft 占六成到十億俱樂部
客戶集中度高得驚人。Microsoft 在 2024 年貢獻 62% 營收,2025 年約 67%。Meta 在原本 14.2B(合約期至 2031-12)的基礎上,於 2026 年 3 月再加簽 21B,總金額拉到約 35.2B 美元、覆蓋至 2032-12。OpenAI 三筆合計可達 22.4B:2025-03 首筆 11.9B、2025-05 加 4B、2025-09 再加 6.5B。Anthropic 於 2026-04 簽下多年合約支援 Claude 訓練與推論,下半年算力會陸續上線。Jane Street 在 2026-04 簽下 6B 美元 AI 雲合約,把量化交易也納入 CoreWeave 池子。
另有 Cohere、Mistral、Perplexity、Hudson River Trading、Adaption Labs、Advaita Bio、World Labs 等名單。重點是「10 家年支出破 10 億美元」這條敘事——當頂級客戶集體押注同一供應商,議價權自我強化。
04 NVIDIA 三位一體:2B 持股、Exemplar Cloud、Rubin 早採
2026-01-26,NVIDIA 公告以每股 87.20 美元注資 2B 美元 Class A 股權,正式成為 CoreWeave 戰略股東。三件事同時發生:第一,CoreWeave 成為首批導入 NVIDIA Rubin 平台、Vera CPU 與 BlueField 智能儲存的雲端營運商;第二,CoreWeave Exemplar Cloud 拿到首批 GB200 NVL72 推論認證,等於 NVIDIA 官方蓋章「跑 Blackwell 認這家」;第三,雙方共建 5 GW 以上 AI 工廠目標 2030 完成。再加上 NVIDIA 早先簽下的 6.3B take-or-pay 容量備援至 2032-04,這是教科書級「合資人、認證者、客戶」三位一體。
05 算力如何計價:H100 / H200 / GB200 按小時對照表
CoreWeave 2026 標價已公開上架,0 ingress / 0 egress / 0 transfer 費。對開發者而言,最該記住的就是這張表:HGX 8 卡節點按需與 Spot、加上 Inference 單卡,是大部分團隊真正會付的價位;GH200、GB200、GB300 則保留聯絡業務的 enterprise 報價。
| GPU 型號 | On-Demand ($/h) | Spot ($/h) | Inference Single ($/h) | 備註 |
|---|---|---|---|---|
| HGX H100 | 49.24 | 19.71 | 6.16 | 8 卡節點,主力訓練 |
| HGX H200 | 50.44 | 20.93 | 6.31 | 8 卡節點,記憶體更大 |
| GH200 | 聯絡業務 | Grace + Hopper Superchip | ||
| GB200 / GB300 | 聯絡業務 | 1 CPU + 2 Blackwell Superchip | ||
| H100 PCIe (Classic) | 4.25 | — | — | 單卡,傳統機型 |
| A100 80GB (Classic) | 2.21 | — | — | 單卡 |
| A100 40GB (Classic) | 2.06 | — | — | 單卡 |
06 Q1 新產品:Flex、Spot、Dedicated Inference、Sandboxes、ARENA
Q1 同時推出五項產品,把計費顆粒度全面打開:Flex Reservations 把長約靈活拆段;Spot Pricing 把 H100/H200 砍到約原價四成,但允許中斷;Dedicated Inference 提供按小時的單卡推論池;CoreWeave Sandboxes 是 RL 訓練用的強隔離環境,避免模型彼此污染;CoreWeave ARENA 則為生產前評估,配合 W&B Weave + W&B Models 擴充版做指標追蹤。對中型團隊而言,Spot + Inference Single 的組合最務實——非關鍵任務先吃 19.71/h 的 H100 Spot,正式推論再切到 Dedicated。
07 融資結構:DDTL 4.0 8.5B、DDTL 5.0 3.1B、股權 2B
2026 YTD 募資總額超過 200 億美元債股組合。DDTL 4.0 為 8.5B 非追索投資等級延期提款定期貸款,浮動利率 SOFR+2.25%、固定約 5.9%;DDTL 5.0 為 3.1B 首筆公開聯貸 HPC 抵押 DDTL,定價 SOFR+4.50%。Moody's 給 Ba2,Fitch 給 BB+,仍在投機級邊緣。加上 NVIDIA 2B 股權挹注,CoreWeave 以「資產抵押+戰略投資人+公開聯貸」三條腿撐起 GW 級擴張。但這份資本結構高度依賴積壓兌現,一旦 take-or-pay 被重新談判,浮動利率會反咬一口。
08 風險面:客戶集中度、Q2 指引偏弱、虧損擴大
財報公布後股價單日跌 10%,市場焦慮非常具體:第一,Microsoft 67% 占比意味著任何一次續約節奏錯位都會折半年營收;第二,Q2 指引中點 2.525B 明顯低於 LSEG 預期 2.69B,暗示新容量爬坡比預期慢;第三,淨虧損 740M、調整後 EPS -1.12 都比去年更深,舉債依賴度上升。換算回採購決策:別把所有 GPU 雞蛋放在一個籃子,非關鍵負載保留 Lambda Labs、Crusoe、Hyperscaler、NVIDIA-IREN 5 GW 與 NVIDIA-Corning 等替代池。
09 給開發者的真實含義:訓練 / 微調 / 在線推論 / 邊緣推論 四檔安置
把上面這些數字翻譯回工程語言,其實是一張很乾淨的決策矩陣。「該不該上 CoreWeave」不是二選一,而是按工作負載分成四檔。下表是我們在實戰中歸納的對照——同一個 LLM 專案,可能同時把不同階段塞進不同池子,才能把帳單壓到合理區間。
| 工作負載 | 建議落腳 | 月成本量級 | 取捨重點 |
|---|---|---|---|
| 大模型訓練 / 全量微調 | CoreWeave HGX H100/H200 池 | 數十萬美元起 | 幾乎唯一可行,鎖長約換折扣 |
| LoRA / 蒸餾 / 短訓 | CoreWeave Spot 19.71/h | 每月千美元級 | 容忍中斷,配 checkpoint |
| 在線推論 | Dedicated Inference 6.16/h | 千至萬美元級 | 關鍵路徑走 Dedicated |
| 邊緣推論 / 小模型 Demo | 自建 Mac / Jetson | 一次性硬體 | 延遲最低、零雲費 |
| iOS 簽署 / 送審 / 公證 / OpenClaw 隔離 | macdate.com 按天租實體 Mac | 1–3 日成本 | GPU 雲完全無解 |
10 並非所有 AI 工作都該上 GPU 雲:iOS / macOS 編譯為何留在 Mac
CoreWeave 解決的是「大規模平行浮點運算」這道題,但 Apple 生態的編譯、簽署、送審、公證鏈條完全是另一條軸。Xcode Archive 必須在 macOS 上跑、Provisioning Profile 與 P12 必須走 keychain、TestFlight 上傳需要 ASC API 與 JWT、macOS 應用程式必須走 notarytool 公證。這些步驟不是「GPU 不夠快」,而是 Apple 從合約面禁止在非授權硬體上跑 macOS。把它們塞進 Linux GPU 雲,等於從零搭建一條走不通的路。
更實務的考量是:許多團隊把 OpenClaw v2026.5.20 之類的 AI 代理放上自己的開發機跑批,但同一台機若同時保管簽署憑證、SSH 私密金鑰、客戶 API key,一次外掛漏洞就可能把整條供應鏈拖下水。隔離環境的成本,遠低於一次帳號封禁或拒審。
11 落地排程:1 至 3 天把短訓放 CoreWeave、把出包放按天租 Mac
給一個真實可複製的節奏。假設你手上有一個下週要交付的 iOS 應用程式,內含一顆需要短時微調的 LLM 模型:
- 第 1 步:盤點工作流——把任務拆成「GPU 微調 + 模型量化匯出」與「iOS 編譯 + 簽署 + 公證 + 上傳」兩條獨立路徑。前者帶寬與算力決定速度,後者證書與環境決定能否過審。
- 第 2 步:CoreWeave 開短期 Spot 節點——以 H100 Spot 19.71/h 跑 LoRA 微調,目標 24 小時內收斂;checkpoint 每 30 分鐘寫一次,避免被回收造成回頭。預算上限以 CLI 寫死,避免溢出。
- 第 3 步:把量化後權重打成 Core ML 套件——透過 coremltools 在容器內完成,再以 0 egress 的優勢直接拉回本地或 S3 兼容物件儲存。
- 第 4 步:在 macdate.com 開一台按天租實體 M4 Mac——只租 1–3 日,乾淨環境跑 Xcode Archive、TestFlight 上傳、必要時 notarytool 公證;憑證走 Fastlane Match 唯讀模式,CI/CD 節點選型可參考此指南。
- 第 5 步:歸還前零殘留清理——刪鑰匙圈、清 DerivedData、撤 Provisioning Profile、清 SSH known_hosts,確保下一位使用者拿到的是完全乾淨的機器。
12 目前方案的限制與更佳選擇
即便 CoreWeave 把訓練端的價格透明化、把 GPU 雲推到了自助下單的門檻,它依舊解決不了 Apple 生態的最後一哩。iOS 與 macOS 的編譯、簽署、Archive、TestFlight、送審、公證、OpenClaw 隔離試跑,每一步都必須跑在真正的 macOS 上、而且最好是一台乾淨、未污染、可隨時歸還的機器。自購 Mac 在這個情境下會發生兩種浪費:硬體 90% 時間閒置、本機長期累積的鑰匙圈與描述檔污染風險越來越高。Xcode Cloud 與 M4 物理集群的對比顯示,1–3 日的短週期需求,按天租實體 Mac 既比自購更便宜、也比共享平台更安全。