CoreWeave 2026 — Warum der grösste Star der AI-Compute-Vermietung:
Q1-Auftragsbestand 99,4 Mrd. USD, H100/H200-Stundenpreise und Entscheidungstabelle GPU-Trainingspool vs Apple-Silicon-Build-Pool
Für Entwickler, CTOs und Infrastructure-Investoren: eine journalistische Einordnung des Q1-2026-Abschlusses von CoreWeave, des Kundenbuchs, der Stundenpreise für H100 und H200 — und der Frage, warum iOS- und macOS-Release-Arbeit weiterhin auf einen tageweise gemieteten Mac gehört.
Für wen dieser Artikel ist. Gründer, die ihren ersten H100-Cluster dimensionieren, CTOs, die zwischen Hyperscaler und Neo-Cloud abwägen, sowie Investoren, die den 99,4 Mrd. USD schweren Auftragsbestand von CoreWeave einordnen müssen. Der Nutzen. Sie verlassen diesen Text mit einem klaren Bild davon, was CoreWeave eigentlich verkauft, was eine H100-Stunde 2026 auf der Liste kostet, wo der Hebel von Spot-Preisen liegt — und welche AI-Workloads bewusst nicht in eine GPU-Cloud, sondern auf Apple Silicon gehören. Die Struktur. Wir nehmen die Q1-Zahlen auseinander, sezieren das Kundenbuch und die NVIDIA-Allianz, legen die Stundenpreise offen, prüfen Kapitalstapel und Risiken und schliessen mit einer Entscheidungsmatrix, die kurzes CoreWeave-Training mit täglich gemieteten Macs für iOS- und macOS-Release-Arbeit kombiniert.
Inhaltsverzeichnis
- Warum die Wall Street CoreWeave den AI-Vermietungs-Star nennt
- Q1 2026: 2,08 Mrd. Umsatz, 99,4 Mrd. Auftragsbestand, 1 GW Richtung 8 GW
- Kundenbuch: von Microsoft 67 Prozent bis zum Milliarden-Club
- NVIDIA in drei Rollen: 2-Mrd.-Halter, Exemplar Cloud, Rubin-Adopter
- Wie Compute verkauft wird: H100/H200/GB200-Stundentabelle
- Q1-Neuerungen: Flex, Spot, Dedicated Inference, Sandboxes, ARENA
- Kapitalstapel: DDTL 4.0 + DDTL 5.0 + 2 Mrd. Eigenkapital
- Risiko: Konzentration, weiche Q2-Guidance, Verlustausweitung
- Für Entwickler: wohin mit Training, Feinabstimmung, Inferenz, Edge
- Nicht jede AI-Aufgabe gehört in die GPU-Cloud
- Praktischer Plan: kurzes Training auf CoreWeave, Release auf Mac
- Grenzen des aktuellen Ansatzes und die bessere Wahl
01. Warum die Wall Street CoreWeave den AI-Vermietungs-Star nennt
CoreWeave, Inc. (Nasdaq: CRWV) unter dem Vorstandsvorsitzenden Michael Intrator vermarktet sich selbst als „The Essential Cloud for AI". In einem Satz: ein ehemaliger Krypto-Miner, der seinen GPU-Bestand in eine börsennotierte Bilanz mit Hyperscaler-Anmutung verwandelt hat — mit 2,08 Mrd. USD Quartalsumsatz, 99,4 Mrd. USD Auftragsbestand und einem Kundenkreis, der von Microsoft und Meta bis zu OpenAI, Anthropic und dem Quant-Haus Jane Street reicht. CRWV ist damit das sauberste Pure-Play auf das Geschäftsfeld AI-Compute-Vermietung, das die öffentlichen Märkte derzeit hergeben.
Diese Stellung interessiert nicht nur Aktienhändler, sondern jedes Entwicklungsteam, das 2026 ein Modell in Produktion bringt. Die CoreWeave-Preisliste ist zur impliziten Benchmark für den fairen Preis einer GPU-Stunde geworden: Hyperscaler kalibrieren ihre Discount-Verhandlungen daran, kleinere Neo-Clouds unterbieten sie taktisch, und jeder Business-Case für einen eigenen Apple-Silicon-Build-Pool wird daran gemessen, wie viele CoreWeave-Stunden er einspart. Wer in diesem Jahr eine LLM-Roadmap finanziert, verhandelt unbewusst gegen diese Liste.
02. Q1 2026 Zahlen: 2,08 Mrd. Umsatz, 99,4 Mrd. Auftragsbestand, 1 GW Richtung 8 GW
Am 7. Mai 2026 meldete CoreWeave 2,08 Mrd. USD Quartalsumsatz — mehr als eine Verdoppelung gegenüber 981,8 Mio. im Vorjahr und über der Konsenserwartung von 1,97 Mrd. Der bereinigte Verlust je Aktie lag bei 1,12 USD und damit unter dem erwarteten Minus von 0,90 USD; der GAAP-Nettoverlust stieg von 315 Mio. auf 740 Mio. USD. Überlagert wurde der Ergebnismisser von einer Zahl, die in keiner Konkurrenzpräsentation in dieser Grössenordnung auftaucht: dem Auftragsbestand von 99,4 Mrd. USD.
Operativ schloss das Quartal mit 1 GW aktiver Leistung und mehr als 3,5 GW vertraglich abgesicherter Leistung; im Quartal kamen rund 400 MW hinzu. Das Management bekräftigte das Ziel von 8 GW bis 2030 und gab an, dass bereits zehn Kunden Commitments von jeweils mindestens 1 Mrd. USD eingebracht haben. Die Q2-Guidance fiel mit 2,45 bis 2,6 Mrd. weicher aus als der LSEG-Konsens von 2,69 Mrd., die Gesamtjahresprognose 2026 wurde auf 12 bis 13 Mrd. festgezurrt.
Drei Schmerzpunkte sollte jeder einkalkulieren, der gerade einen Vertrag verhandelt:
- Compute-Preis. Die HGX-H100-Stunde auf Abruf kostet 49,24 USD je GPU. Ein einziger Acht-GPU-Knoten rund um die Uhr für einen Monat überschreitet damit 283.000 USD — vertretbar für einen Trainingslauf im zweistelligen Millionenbereich, ruinös für ein Notebook, das offen bleibt.
- Mindest-Take-or-Pay. Der 99,4-Mrd.-Auftragsbestand besteht überwiegend aus mehrjährigen Verträgen mit Mindestabnahme. Die wirklich günstigen Stückpreise erhält nur, wer Kapazität für Jahre vorab bindet — nicht für ein Wochenende.
- Keys und Datenkonformität. Dass CoreWeave keine Ingress-, Egress- oder Transfergebühren erhebt, ist tatsächlich differenzierend. Die harte Frage ist organisatorisch: Modellgewichte, Kundendaten und vor allem Signatur-Schlüssel benötigen ein Custody-Konzept, das die meisten Teams unterschätzen.
03. Kundenbuch: von Microsoft 67 Prozent zum Milliarden-Club
Auf der Kundenseite verliert CoreWeave den Charakter eines Cloud-Start-ups und wirkt eher wie ein Hyperscaler im Werden. Microsoft stand 2024 für 62 Prozent des Umsatzes und 2025 für rund 67 Prozent. Diese Konzentration ist Analystenfutter — und gleichzeitig der Anker, der das übrige Buch ökonomisch erst möglich gemacht hat.
Meta ist der grösste Nicht-Microsoft-Vertrag: zur bestehenden Vereinbarung über 14,2 Mrd. USD mit Laufzeit bis Dezember 2031 kam im März 2026 ein weiterer Kontrakt über 21 Mrd. USD bis Dezember 2032 — kumuliert rund 35,2 Mrd. USD. OpenAI summiert sich über drei Tranchen — 11,9 Mrd. im März 2025, 4 Mrd. im Mai und 6,5 Mrd. im September — auf etwa 22,4 Mrd. USD. Anthropic unterzeichnete im April 2026 einen mehrjährigen Kapazitätsvertrag für Claude; die Kapazität soll im zweiten Halbjahr 2026 verfügbar sein.
Die Aprilmeldungen brachten zusätzlich Jane Street mit einem 6 Mrd. USD schweren AI-Cloud-Vertrag — die erste signifikante Bewegung der Firma in die quantitative Finanzwelt und das deutlichste Signal, dass Trading-Desks GPU-Cluster als primäre Forschungsfläche betrachten. Strategisch relevant, aber kleiner sind Cohere, Mistral, Perplexity, Hudson River Trading, Adaption Labs, Advaita Bio und Fei-Fei Lis World Labs. Zusammen machen sie aus den 99,4 Mrd. einen verteidigungsfähigen Backlog statt einer Marketingzahl.
04. NVIDIA in drei Rollen: 2-Mrd.-Halter, Exemplar Cloud, Rubin-Adopter
Die folgenreichste Beziehung von CoreWeave ist kein Kundenvertrag, sondern eine Lieferantenbindung. Am 26. Januar 2026 zeichnete NVIDIA Class-A-Aktien für 2 Mrd. USD zu 87,20 USD pro Stück und richtete den grössten GPU-Hersteller damit auf den grössten reinen GPU-Vermieter aus. Gemessen an den Marktkapitalisierungen ist die Transaktion klein, das Signal ist umso lauter: NVIDIA will CoreWeave als bevorzugten Distributionskanal sehen.
Über das Eigenkapital hinaus sicherte NVIDIA eine Take-or-Pay-Kapazität von bis zu 6,3 Mrd. USD bis April 2032 zu. Beide Unternehmen kündigten einen gemeinsamen Aufbau von mehr als 5 GW AI-Fabriken bis 2030 an, und CoreWeave wurde zur ersten NVIDIA Exemplar Cloud für die GB200-NVL72-Inferenzzertifizierung. Hinzu kommt der frühe Einsatz der Rubin-GPU-Familie, der Vera-CPU und des BlueField-Storage-Stacks. Für Entwickler bedeutet das eine pragmatische Faustregel: Was in NVIDIAs Referenz-Stack zuerst funktioniert, ist meist zuerst auf CoreWeave verfügbar.
05. Wie Compute verkauft wird: H100, H200, GB200 — Stundentabelle
Bemerkenswert für die Branche: CoreWeave veröffentlicht eine offene Stundenliste. Die folgenden Listenpreise 2026 berücksichtigen keine Committed-Use-Rabatte, eignen sich aber als Ankerpunkt für jede TCO-Kalkulation. Spot-Pricing wurde in diesem Jahr erstmals eingeführt und verändert die Rechnung für fehlertolerante Trainingsläufe und Offline-Batch-Inferenz spürbar.
| SKU | On-Demand pro GPU-Stunde | Spot pro GPU-Stunde | Inference Single pro GPU-Stunde |
|---|---|---|---|
| HGX H100 | 49,24 USD | 19,71 USD | 6,16 USD |
| HGX H200 | 50,44 USD | 20,93 USD | 6,31 USD |
| GH200 | Vertrieb kontaktieren | n/a | n/a |
| GB200 / GB300 Superchip (1 CPU + 2 Blackwell GPUs) | Vertrieb kontaktieren | n/a | n/a |
| Classic H100 PCIe | 4,25 USD | n/a | n/a |
| A100 80 GB | 2,21 USD | n/a | n/a |
| A100 40 GB | 2,06 USD | n/a | n/a |
Zwei Beobachtungen drängen sich auf. Erstens: Die Spreizung zwischen Spot- und On-Demand-Preis liegt bei H100 und H200 bei etwa 60 Prozent. Wer seine Trainingsschleife alle 1.000 Schritte sauber checkpointed, lässt mit On-Demand bares Geld liegen. Zweitens: Der Abstand zwischen HGX und der klassischen PCIe- oder Ampere-Generation ist mehr als zehnfach. Für kleine Feinabstimmungen oder akademische Evaluierungen ist eine A100 mit 80 GB für 2,21 USD häufig die rationalere Wahl. Dass weder Ingress noch Egress noch Transfer abgerechnet werden, ist in der Branche ungewöhnlich und verändert insbesondere die Ökonomie multiregionaler Setups.
06. Q1-Neuerungen: Flex, Spot, Dedicated Inference, Sandboxes, ARENA
Die Release-Notes zum Quartal sind aus Entwicklersicht spannender als der reine Finanzbericht. Flex Reservations erlauben es Teams, eine Basiskapazität zu binden und gegen einen geteilten Burst-Pool zu spitzen — endlich ein Hyperscaler-ähnliches Hüllkurvenmodell für mittelgrosse Labore, ohne dass der Scheck ebenfalls Hyperscaler-Format annehmen muss. Spot Pricing öffnet die oben skizzierten 60-Prozent-Rabattfenster. Dedicated Inference trennt Produktions-Serving sauber von Forschungsclustern, damit ein lauter Trainingslauf nicht das Latenzbudget der Live-API zerschiesst.
CoreWeave Sandboxes ist die interessanteste Neuerung für Agenten- und Reinforcement-Learning-Teams: eine isolierte Laufzeitumgebung, die über Weights & Biases für RL-Rollouts und Agenten-Traces bereitsteht — eine einzige falsch geratene Aktion soll nicht in den Cluster lecken. CoreWeave ARENA ergänzt eine Pre-Production-Evaluation auf realem Verkehr, bevor ein Kandidatenmodell befördert wird. Hinzu kommen erweiterte Integrationen für W&B Weave und W&B Models. Die Botschaft ist klar: Observability soll mit der Rechenleistung gebündelt sein.
07. Kapitalstapel: DDTL 4.0 (8,5 Mrd.) + DDTL 5.0 (3,1 Mrd.) + 2 Mrd. Eigenkapital
Die Refinanzierungsseite ist ebenso aggressiv wie das Wachstum. Im laufenden Jahr hat CoreWeave bereits über 20 Mrd. USD an Fremd- und Eigenkapital eingesammelt. Zwei Transaktionen stechen heraus. DDTL 4.0 ist ein nicht-rückgriffsfähiger, Investment-Grade-Delayed-Draw-Term-Loan über 8,5 Mrd. USD zu SOFR plus 2,25 Prozent variabel — fest rund 5,9 Prozent. DDTL 5.0 umfasst 3,1 Mrd. USD und ist die erste öffentlich syndizierte HPC-besicherte DDTL-Tranche der Branche; das finale Pricing liegt bei SOFR plus 4,50 Prozent, 50 Basispunkte enger als die ursprüngliche Indikation, mit einem Rating von Moody's Ba2 und Fitch BB+.
Darauf gesetzt wird die schon erwähnte Eigenkapitalspritze von NVIDIA über 2 Mrd. USD. Die Kombination zeigt: CoreWeave kann im selben Geschäftsjahr öffentliche Anleihen, syndizierte HPC-besicherte Schulden und strategisches Eigenkapital des wichtigsten Lieferanten gleichzeitig abrufen. Kaum ein privater Wettbewerber kann diese Tripel-Finanzierung spiegeln. Die Kehrseite: Eine schuldenlastige Struktur gegen mehrjährige Take-or-Pay-Assets ist immer nur so robust wie der Boden des AI-Nachfragezyklus.
08. Risiko: Konzentration, weiche Q2-Guidance, Verlustausweitung
Die Bear-Case-Erzählung ist nicht schwer zu schreiben. Der Q1-Nettoverlust weitete sich auf 740 Mio. USD aus, obwohl sich der Umsatz verdoppelte. Die Q2-Guidance lag unter dem LSEG-Konsens von 2,69 Mrd., die Aktie verlor am Ergebnistag rund 10 Prozent. Die Kundenkonzentration bleibt das lauteste Risiko: Microsoft stand 2025 für rund 67 Prozent des Umsatzes, und auch wenn dieser Anteil mit Meta, OpenAI, Anthropic und Jane Street kleiner wird, dürfte das Buch in Analystenmodellen mehrere Quartale lang nicht als diversifiziert gelten.
Der Kapitalstapel ist das zweitwichtigste Risiko. Investment-Grade-DDTLs sind 2026 billiges Geld, bleiben aber variabel verzinste Schulden, die gegen Hardware mit drei- bis fünfjähriger ökonomischer Lebensdauer abgesichert sind. Eine spürbare Verlangsamung der Frontier-Nachfrage oder eine schnellere Commodifizierung der Inferenz würde genau die Verträge unter Druck setzen, die den Backlog tragen. Hinzu kommen die Wettbewerber Lambda Labs, Crusoe, die Hyperscaler AWS, Azure und GCP sowie die NVIDIA-Partnerschaften mit IREN (5 GW) und Corning.
09. Für Entwickler: wohin mit Training, Feinabstimmung, Online- und Edge-Inferenz
Spannender als die Aktienfrage ist die operative: Wohin gehört welcher Workload? Die folgende Matrix fasst zusammen, wie wir 2026 vorgehen — mit den 49,24 USD pro GPU-Stunde als Ankerpunkt auf der rechten Seite.
| Workload-Klasse | Empfohlener Anbieter | Kostenform |
|---|---|---|
| Foundation-Model-Pretraining | CoreWeave (Committed mehrjährig, GB200/Rubin) | Mengenrabattierte GPU-Stunde; Bindung belohnt |
| Grosse Feinabstimmung & RLHF | CoreWeave Spot (19,71 USD/h HGX H100) oder Hyperscaler Reserved | Checkpoint-tolerant; ca. 60 Prozent Spot-Rabatt |
| Produktions-Echtzeit-Inferenz | CoreWeave Dedicated Inference oder Hyperscaler-Region nahe Nutzer | Per Request; latenz- und regionsgebunden |
| Batch-/Offline-Inferenz | CoreWeave Spot oder eigene GPU, falls bereits abgeschrieben | Durchsatz pro Euro; absorbiert Capex-Reste |
| RL-Rollouts & Agenten-Schleifen | CoreWeave Sandboxes via W&B | Isolierte Laufzeit; stündlich mit Sicherheitsgrenzen |
| Kleinmodell-F&E / akademisch | Classic H100 PCIe (4,25 USD/h) oder A100 80 GB (2,21 USD/h) | Günstige GPU-Stunde; eigene Orchestrierung |
| On-Device-/Edge-Inferenz | Apple Silicon (M3/M4 Neural Engine, Core ML) | Capex amortisiert; keine Cloud-Kosten pro Request |
| iOS/macOS Build, Signierung, Archive, Release | Tagesmiete-Mac (macdate.com Bare-Metal M4) | Tagessatz; isolierte Zertifikate, dedizierte Bandbreite |
Das Muster ist deutlicher, als viele es erwarten: CoreWeave gewinnt überall dort, wo der Engpass GPU-förmig ist. Es hat nie versucht, dort zu gewinnen, wo der Engpass eine codesignierte Apple-Binärdatei ist, die durch Notarisierung läuft.
10. Nicht jede AI-Aufgabe gehört in die GPU-Cloud: iOS- und macOS-Builds bleiben auf dem Mac
Zu viele Gespräche behandeln „die Cloud" 2026 noch wie ein einziges Ziel. Apples Release-Pipeline ist jedoch eine harte Anforderung, die keine GPU-Cloud erfüllen kann. Xcode Archive benötigt einen aktuellen macOS-Host mit passender Xcode-Version. TestFlight-Uploads erwarten Transporter auf einem Mac. App Review verwirft Builds, deren Info.plist zwischen lokaler Workstation und CI-Pipeline auseinanderläuft. Die Notarisierung verlangt Apple-Anmeldedaten und eine Hardened-Runtime, die sich auf einem Linux-GPU-Knoten nur mit erheblichem Aufwand nachbilden lässt.
Genau deshalb halten selbst Teams, die Trainingsläufe im siebenstelligen Bereich auf CoreWeave fahren, eine separate Mac-Fläche für die letzte Meile vor. Dieselbe Logik gilt für die OpenClaw-Isolation agentischer und AI-Coding-Workloads: Eine modellgesteuerte Shell hat weder auf der Maschine etwas verloren, mit der die App-Store-Builds signiert werden, noch auf einem GPU-Knoten ohne native macOS-Toolchain. Ein täglich gemieteter physischer Mac, sauber getrennt vom Daily Driver, ist die sauberste Antwort. Für die Multi-Modell-Seite empfehlen wir den Leitfaden zur OpenClaw-Optimierung auf M4 Neural Engine.
11. Praktischer Plan: kurzes Training auf CoreWeave, Build und Release auf täglicher Mac-Miete
Folgender Zeitplan hat sich bei Teams bewährt, die beide Flächen brauchen, ohne eines der beiden Budgets zu verbrennen. Er ist bewusst unspektakulär; entscheidend ist die Wiederholbarkeit über zwei Wochen.
- Tag 0 — Bereitstellung. HGX-H100-Reservierung auf CoreWeave für das Trainingsfenster anlegen. Spot zu 19,71 USD/h wählen, wenn das Skript alle 1.000 Schritte checkpointed; sonst 49,24 USD On-Demand. Parallel einen Tagesmiete-M4 auf macdate.com reservieren, damit die Signaturkette steht, sobald das Modell landet.
- Tag 1 bis 3 — Training. Den Sweep starten. Artefakte in derselben Region halten — Egress kostet nichts, finale Gewichte werden gratis abgezogen. Metriken nach W&B Weave streamen. Reservierung sofort beenden, wenn der Run durch ist.
- Tag 3 — Übergabe. Das fusionierte Artefakt und eine Core-ML-Konvertierung auf den gemieteten Mac exportieren. In Xcode öffnen, prüfen, dass die
Info.plist-Entitlements zum App-Store-Target passen. Wer zusätzlich über OpenClaw routet, folgt unserem internen Runbook zur Isolation. - Tag 4 — Archive, Signierung, TestFlight.
xcodebuild archiveauf einem sauberen Schlüsselbund laufen lassen, der ausschliesslich die Zertifikate dieses Releases enthält. Hardened Runtime bestätigen, zur Notarisierung einreichen, anschliessend per Transporter ins interne TestFlight hochladen. Externe Promotion erst nach rund 200 Prompts ohne Guardrail-Verletzung. - Tag 5 — App Review. Einreichung mit aktuellen Privacy-Manifesten und einer Export-Compliance-Antwort, die zur Model Card passt. Den Mac 24 bis 48 Stunden warmhalten, falls Re-Uploads angefordert werden.
- Tag 6 und folgende — Abbau. Nach Going-Live das Mac-Image archivieren, das Release-Zertifikat widerrufen, den Knoten zurückgeben. Die Mac-Ausgabe bleibt ein kleines Vielfaches des Tagessatzes — kein Monatspreis für einen leerstehenden Desktop. Wer einen längeren Build-Pool betreibt, sollte zusätzlich den Xcode-Build-Leitfaden 2026 und den Entscheidungs-Vergleich Xcode Cloud vs. Mac-Tagesmiete konsultieren.
12. Grenzen des aktuellen Ansatzes und die bessere Wahl
Die ehrliche Lesart: CoreWeave ist 2026 der beste öffentliche Stellvertreter des Marktes für AI-Compute-Vermietung und sinnvolle Infrastruktur für jedes Team, das mehr als eine Handvoll H100s benötigt. Es ersetzt aber keinen Mac. Selbst mit günstigem CoreWeave-Training müssen iOS- und macOS-Kompilierung, Code-Signierung, Xcode Archive, TestFlight, App Review, Notarisierung und OpenClaw-Agent-Isolation weiterhin auf einem aktuellen Mac mit einem sauberen Schlüsselbund laufen. Das ist eine harte Apple-Anforderung, an der sich auch das tiefste GPU-Budget nicht vorbeisparen lässt.
Die naive Antwort lautet, einen Mac mini M4 Pro oder ein Mac Studio zu kaufen, das 90 Prozent des Monats im Leerlauf steht — eine teure Capex-Bindung. Die etwas weniger naive Antwort, Release-Arbeit auf der Hauptmaschine zu erledigen, verunreinigt persönliche Zertifikate und leakt Signatur-Material in jedes alltägliche npm install oder git pull. Die saubere Antwort für jedes Fenster von ein bis drei Tagen lautet: ein täglich gemieteter Mac auf macdate.com — ein physischer M4-Bare-Metal-Knoten mit dedizierter Bandbreite, ohne Zertifikatsverunreinigung, mit klarem Abbau am Ende. In Kombination mit CoreWeave auf der GPU-Seite ist das die sauberste Aufteilung dieses Zyklus.