Die KI-Nutzung nimmt Fahrt auf, doch die Rechnung fällt höher aus als erwartet. Uber hat sein KI-Budget bereits im April aufgebraucht. Microsoft erstellt aus Kostengründen keinen Code mehr mit Claude. Gleichzeitig monieren Kritiker aufgepumpte Umsätze. Gerät der milliardenschwere Finanzierungskreislauf ins Stocken?
Die Rechnung für den KI-Boom fällt höher aus als erwartet. Der Fahrdienstvermittler Uber hatte KI-Werkzeuge wie Claude Code und Cursor tausenden Entwicklern zur Verfügung – und nun sein gesamtes KI-Programmierbudget für das Jahr 2026 bereits im April aufgebraucht. Offenbar verursachten dabei einige Mitarbeiter monatliche API-Gebühren von 500 bis 2.000 US-Dollar pro Person. Das geht aus einem internen Memo hervor, das der Uber-CTO an die Belegschaft verschickte.
Damit steht Uber nicht allein: Sogar Microsoft zog jüngst Konsequenzen und forderte seine Mitarbeiter auf, den Claude Code des Konkurrenten Anthropic intern nicht weiter zu nutzen, nachdem der Tokenverbrauch untragbar geworden war – und das trotz einer milliardenschweren Partnerschaft von Microsoft mit Anthropic.
KI-Budgets verdampfen in Monaten
Auslöser für die Kostenlawine ist die Preispolitik der KI-Anbieter: Anthropic, OpenAI und Google haben in den vergangenen sechs Monaten die effektiven Preise schrittweise angehoben. Nachdem viele Large Language Modelle (LLM) anfangs kostengünstig oder sogar komplett kostenlos waren, sind die Preise in den USA laut Marktbeobachtern zuletzt um 20 bis 37 Prozent gestiegen. Zudem gaben Anbieter wie GitHub ihre Pauschalpreismodelle auf und stellten auf nutzungsbasierte Abrechnung auf Basis der eingesetzten Tokens um. Dadurch schossen die Kosten massiv in die Höhe – selbst bei Nvidia. Bryan Catanzaro, Vice President für angewandtes Deep Learning bei Nvidia, musste kürzlich einräumen, dass sein Team mittlerweile mehr für Rechenleistung als für Gehälter ausgibt.
Der Preisanstieg trifft vor allem die Early Adopters, also Unternehmen, die ihre KI-Workflows in der Erwartung dauerhaft sinkender Kosten aufgebaut haben. Sie sind nun erstmals gezwungen, die tatsächlichen Kosten für den Betrieb dieser Modelle im großen Maßstab zu tragen. Günstigere Chips dürften dieses Problem kaum lösen: Niedrigere Tokenpreise führen erfahrungsgemäß zu höheren Aufgabenmengen für KI-Agenten – die Gesamtrechnung steigt trotzdem.
Dass nun sogar große Kunden ihre Mitarbeiter drängen, die Nutzung von KI selektiver einzusetzen, bringt auch die KI-Anbieter in ein Dilemma: Schrauben die Kunden von Anthropic, OpenAI & Co. ihre Nutzung zurück, um Budgets einzuhalten, verlangsamt sich das Umsatzwachstum. Das aber brauchen die KI-Labore, um ihre Multi-Milliardenbewertungen vor den geplanten Börsengängen zu rechtfertigen. Würden die Anbieter dagegen nun wieder die Preise senken, verschlechtert das ihre Margen und damit die Monetarisierung genau zum falschen Zeitpunkt.
Der Trick hinter den Rekordumsätzen
Kritiker sehen im Geschäftsmodell der Branche tiefe Risse. Denn noch ein zweiter Punkt stößt Beobachtern zunehmend auf. Es geht um die Bilanzierung der KI-Umsätze in der Gewinn- und Verlustrechnung. Ähnlich wie bei den Investitionen, die Kritikern zufolge auf einen viel zu langen Zeitraum abgeschrieben werden, um die Kosten niedrig und die Gewinne hoch zu halten, haben Bilanzexperten jetzt Auffälligkeiten bei der Umsatzverbuchung entdeckt. Es geht um die ausgewiesenen Cloud-Umsätze, von denen ein erheblicher Teil auf sogenannten „Round-Trip-Revenue-Loops“ basieren soll. Und so funktioniert das:
Ein Tech-Konzern investiert Milliarden in KI-Startups. Diese Milliarden fließen aber nicht real per Banküberweisung, sondern oft in Form von Cloud-Guthaben. Die Startups geben dieses Buchgeld dann wieder unmittelbar für Rechenleistung bei demselben Konzern aus – und der wiederum verbucht diese Rückflüsse als frischen Umsatz. Von außen sieht es aus wie das perfekte Perpetuum Mobile. Mit dem Schönheitsfehler, das intern, beim errechnen der KI-Aufgaben, echte Kosten in Form von Strom und Abschreibungen auf die benutzten Rechenchips entstehen.
Auf der Plattform X.com wies ein User am Wochenende darauf hin, dass Microsoft, Amazon, Google und Oracle mittlerweile rund zwei Billionen US-Dollar an „zukünftigen Cloud-Verpflichtungen“ auswiesen. Von dieser Summe entfalle die Hälfte auf OpenAI und Anthropic. Anders gesagt: Vier Billionen-Dollar-Konzerne verlassen sich auf zwei bislang unprofitable Startups.
Microsofts 13 Milliarden US-Dollar schwere Beteiligung an OpenAI gilt den Kritikern dabei als Musterbeispiel: Die Investition bestand zu einem großen Teil aus Azure-Cloud-Guthaben. OpenAI nutzte diese Guthaben, um seine LLM-Modelle zu trainieren, Microsoft verbuchte den Verbrauch als neue Umsätze. OpenAIs jährliche Cloud-Rechnung soll sich nach Informationen von Lockridge Okoth von beincrypto.com mittlerweile auf mehr als 60 Milliarden US-Dollar aufgetürmt haben. Das wäre mehr als doppelt so viel wie der eigene Umsatz OpenAI, der auf rund 25 Milliarden US-Dollar geschätzt wird. Anthropic soll derselben Quelle zufolge in nur neun Monaten 2,66 Milliarden US-Dollar bei Amazon Web Services ausgegeben haben – das entspricht nahezu jedem verdienten Dollar.
Papiergewinne statt echtes Geld
Das Problem daran sind nicht nur aufgeblasene Umsätze bei den Hyperscalern. Hinzu kommen noch die Bewertungsgewinne für ihre Anteile an den KI-Newcomern. Bei jeder neuen Finanzierungsrunde für ein KI-Startup stieg bislang die Bewertung an. Das erlaubt es dem investierten Tech-Konzern, seine Beteiligung aufzuwerten und den Buchgewinn direkt ins Nettoergebnis einzurechnen. Alphabet erzielte im ersten Quartal 2026 einen Rekordgewinn von 62,6 Milliarden US-Dollar – davon entfielen jedoch allein 28,7 Milliarden US-Dollar auf die Neubewertung der Anthropic-Beteiligung. Amazon wies im selben Zeitraum einen Nettogewinn von 30,3 Milliarden US-Dollar aus, von dem 16,8 Milliarden US-Dollar ebenfalls auf Anthropic-Buchgewinne entfielen. Gleichzeitig brach der tatsächliche freie Cashflow von Amazon um 95 Prozent auf 1,2 Milliarden US-Dollar ein, weil 44,2 Milliarden US-Dollar in den Bau neuer, physischer Rechenzentren flossen.
Bei Microsoft sind nach Angaben des X-Accounts "Bull Theory" mittlerweile 49 Prozent des zukünftigen Auftragsbestands von 627 Milliarden US-Dollar an OpenAI gebunden. Oracle verlässt sich noch stärker auf diesen Kunden: 54 Prozent seines Auftragsbestands von zuletzt 553 Milliarden US-Dollar beruhen allein auf OpenAI.
🚨 THE ENTIRE AI BOOM MIGHT BE BUILT ON FAKE REVENUE.
— Bull Theory (@BullTheoryio) May 23, 2026
Latest corporate filings show that OpenAI and Anthropic alone make up over half of the entire $2 trillion future cloud backlog held by Microsoft, Oracle, Google, and Amazon.
This massive pipeline is actually being created… pic.twitter.com/FejQ1KHbXR
Dotcom lässt grüßen
Beobachter vergleichen das Muster mit dem Dotcom-Crash des Jahres 2001, als Unternehmen wie Global Crossing und Qwest Communications damit begann, identische Glasfasernetzkapazitäten austauschten, um beim jeweils anderen fiktive Umsätze zu erzeugen. Qwest musste schließlich auf Druck der Wertpapieraufsicht 1,4 Milliarden US-Dollar an fiktivem Einkommen wieder streichen, Global Crossing ging insolvent. Der entscheidende Unterschied zu heute: Die damaligen Tauschgeschäfte waren damals schon illegal – der oben beschriebene KI-Finanzierungskreislauf ist unter den aktuellen Bilanzierungsregeln jedoch vollständig erlaubt.
Der Beweis, dass KI sich auch rechnet, steht noch aus
Der Vermögensverwalter Fidelity läutet bei seinen Kunden bereits die Alarmglocke: Er hat ein eigenes KI-Blasenmodell aufgestellt, für das er fünf Warnsignale definiert:
- die Geschwindigkeit des gesamten Gewinnwachstums;
- die Gesamtqualität der Gewinne;
- die Bewertungen im Vergleich zur historischen Entwicklung;
- die Erschwinglichkeit und Nachhaltigkeit der Investitionsausgaben von Unternehmen;
- den Zyklus der Zinssätze.
In den Quartalsergebnissen der großen Tech-Konzerne aus dem ersten Quartal 2026 zeigen sich zwei davon bereits deutlich: die sinkende Qualität der ausgewiesenen Gewinne (gemessen am Anteil der Buchgewinne) und die wachsende Frage nach der Nachhaltigkeit der Investitionsausgaben.
Die geplanten Börsengänge von OpenAI, Anthropic und auch xAI im Gewand von SpaceX werden damit zum Lackmustest für den KI-Boom. Gerüchten zufolge stellen erste Investoren die hohen angestrebten Bewertungen bereits in Frage. Das könnte dann im nächsten Schritt auch für die Hyperscaler gelten, sobald Analysten die Luft aus den Umsätzen lassen.
So holen Sie sich alle KI-Champions auf einmal
Mit dem „Künstliche Intelligenz-Index“ von BÖRSE ONLINE investieren Sie gleichzeitig in 17 führende Treiber des KI-Booms.
Hier mehr erfahren.
Häufige Fragen zum Thema
Warum rechnet die KI-Welt in "Token"?
Ein Token ist die kleinste Text- oder Dateneinheit, die ein Sprachmodell wie ChatGPT, Gemini oder Claude verarbeiten kann. Sprachmodelle (LLMs) denken nicht in Wörtern wie Menschen, sondern wandeln jeden Buchstaben oder jede Silbe in Zahlen (Vektoren) um. Bevor die KI einen Text verarbeitet, zerlegt ein sogenannter Tokenizer den Eingabetext in diese Bruchstücke. Deshalb ist ein Token nicht immer exakt ein Wort. Im Englischen entspricht ein Token im Durchschnitt etwa vier Zeichen oder 0,75 Wörtern. So besteht zum Beispiel der Begriff "Künstliche Intelligenz" aus 2 Wörtern, wird aber von den LLM-Algorithmen je nach Modell in 3 bis 5 Tokens zerlegt. Komplexe Wörter oder Sprachen mit vielen zusammengesetzten Wörtern , wie etwa Deutsch, benötigen deshalb für dasselbe Wort meist mehr Tokens als für den englischen Begriff.
Was kostet ein KI-Token?
Das ändert sich ständig, die Kosten variieren auch stark zwischen günstigen Modellen und High-End-Modellen: Ältere, langsamere Modelle wie GPT-4o mini oder Gemini Flash kosten etwa 15 bis 60 US-Cent pro eine Million Input-Tokens. Stärkere Modelle wie GPT-5 oder Claude Opus verlangen jüngsten Angaben zufolge etwa 1,50 bis 5,00 US-Dollar für eine Million Input-Tokens.
Sind die Preise für die Tokens kostendeckend?
Bisher offenbar nicht: OpenAI schreibt noch keine Gewinne, Anthropic offenbar auch nicht. Denn jede KI-Anfrage verursacht auch echte Kosten für das Datenmangement, Mitarbeiter, den Strom oder auch die anteilige Abschreibung auf die verwendeten Chips.