SaaS-Portfolios brauchen eine Exit-Strategie, kein nächstes Tool
Eva Mickler
7 Min. Lesezeit Die einfachen SaaS-Konsolidierungen sind durch. Wer doppelte Tools streichen wollte, ...
5 Min. Lesezeit
Google hat am 22. April 2026 auf Cloud Next in Las Vegas die achte TPU-Generation vorgestellt und dabei erstmals Training und Inference hardwareseitig getrennt. TPU 8t vernetzt bis zu 9.600 Chips für Training-Workloads, TPU 8i bündelt 1.152 Chips pro Inference-Pod mit dem dreifachen On-Chip-SRAM. Parallel ging die Gemini Enterprise Agent Platform live. Für Vorstände deutscher Konzerne ist das kein Technologie-Detail, sondern eine neue Einkaufs-Dimension, die im nächsten IT-Investitions-Review auftauchen wird.
Das Wichtigste in Kürze
VerwandtGartner IT-Spending 2026: 6.150 Milliarden / Managed Services Build vs. Buy 2026
Google-CEO Sundar Pichai hat im Keynote-Fenster 10:00 PST drei Produkt-Bausteine vorgestellt. Die TPU-8-Generation ist der sichtbarste, aber nicht der strategisch wichtigste. TPU 8t verwendet eine neue Inter-Chip-Interconnect-Technologie und verknüpft bis zu 9.600 TPUs plus zwei Petabyte Shared-High-Bandwidth-Memory in einem einzigen Superpod. Google spricht von dreifacher Leistung gegenüber Ironwood. TPU 8i ist der Inference-Zwilling: 1.152 Chips pro Pod, dreifache On-Chip-SRAM-Kapazität, optimiert für niedrige Latenz bei Millionen parallelen Agent-Requests.
Der zweite Baustein ist die Gemini Enterprise Agent Platform. Sie ging am 22. April direkt in die allgemeine Verfügbarkeit. Google hat den Umsatz der Vorgänger-Plattform im ersten Quartal 2026 mit plus 40 Prozent paid-Monthly-Active-Users quartalsweise angegeben. Parallel haben Accenture und BCG Partnerschafts-Erweiterungen zum Gemini Enterprise Acceleration Program gemeldet. Mars nutzt die Plattform für 150.000 Mitarbeitende. Merck hatte bereits am 22. April eine eigene Eine-Milliarde-Dollar-Agentic-AI-Allianz mit Google Cloud angekündigt, die wir an anderer Stelle als Template für Vorstandsentscheidungen eingeordnet haben.
Der dritte Baustein, der in Boards unterschätzt wird, ist das Agent-to-Agent-Protocol. Google hat es als offenen Standard positioniert, OpenAI und Anthropic haben Interoperabilitäts-Signale gegeben. Damit entsteht ein Ökosystem, das Agent-Kommunikation provider-übergreifend definiert. Für die IT-Strategie heißt das: Lock-in-Argumente verschieben sich vom einzelnen Modell zur Infrastruktur-Schicht darunter.
Was ist TPU 8i? TPU 8i ist die Inference-Variante der achten Google-TPU-Generation, angekündigt am 22. April 2026 auf Cloud Next. Sie verbindet 1.152 Chips pro Pod mit dreifachem On-Chip-SRAM gegenüber der Vorgänger-Generation Ironwood und ist explizit für die parallele Ausführung autonomer KI-Agenten optimiert. Die Trennung zwischen Training (TPU 8t) und Inference (TPU 8i) ist das strategische Signal: Google behandelt die beiden Workload-Typen als eigenständige Produkte mit eigener Preis- und Skalierungslogik.
Die Ansage an den Vorstand ist nicht, jetzt eine Google-TPU-Roadmap zu kaufen. Sie ist, die Vokabeln zu kennen, bevor die IT-Leitung die Budgetfrage stellt. Drei Punkte gehören in die nächste Board-Sitzung, unabhängig davon, welche Hyperscaler-Präferenz das Unternehmen hat.
Erstens: Inference-Kapazität als eigene Einkaufsgröße. Bis Cloud Next 2026 haben viele IT-Teams Inference und Training zusammengerechnet. Google trennt das jetzt hardwareseitig. AWS hatte bereits im vergangenen Jahr Trainium 2 und Inferentia 3 ausdifferenziert. Die strategische Konsequenz: Budgetplanungen müssen zwei Zahlen führen, nicht eine. Wer das verwechselt, kalkuliert Peak-Kapazität als Basislast und zahlt den Aufschlag.
Zweitens: Build, Buy oder Managed. Der Gemini-Enterprise-Agent-Launch verkürzt die Time-to-Deployment für Agenten dramatisch. Die Vorstandsfrage ist nicht „wollen wir Agenten bauen“, sondern „bauen wir selbst, kaufen wir Standard-Agenten, oder mieten wir eine Managed-Agent-Lane“. Die gleiche Unterscheidung, die 2025 beim Thema Managed Services bereits geklärt wurde, kehrt jetzt auf Agenten-Ebene wieder. Die BCG-Partnerschaft mit Google zeigt, wohin der Markt drückt: Bundles aus Plattform plus Integration plus Change-Management werden das Einkaufs-Standardpaket.
Drittens: Souveränitäts-Fragen neu stellen. Mit TPU 8i wird Google technologisch schwieriger einholbar. Europäische Cloud-Provider, die auf NVIDIA-Chips sitzen, müssen bei Inference-Preisen mit einem integrierten Hyperscaler konkurrieren. Das ist nicht verboten, aber es ändert die ökonomische Gleichung. Für DACH-Vorstände, die Datenstandort-Garantien brauchen, wird die Entscheidung zwischen EU-Provider und Hyperscaler härter, nicht weicher.
Ein Vorstand, der 2026 keine Position zu Inference-Kapazität und Agent-Governance hat, trifft die nächste IT-Budget-Entscheidung blind. Google Cloud Next war das Signal, dass der Markt gerade die Fragen definiert, bevor die Antworten kursieren.
Drei Reflexe sind in den nächsten Wochen nützlich. Erstens: die eigene Agent-Roadmap prüfen. Wer aktuell Pilot-Agenten auf generischer LLM-Infrastruktur fährt, sollte im nächsten Lenkungskreis die Frage nach Produktiv-Kapazität stellen. Zweitens: die Vertragslage gegenüber Hyperscaler dokumentieren. Welche Exit-Optionen sind zwei Jahre nach Roll-out realistisch, wenn TPU 8i der Standard geworden ist? Drittens: Compliance früh einschalten. Agent-to-Agent-Kommunikation wirft haftungsrechtliche Fragen auf, die weder DORA noch NIS2 sauber adressieren. Das wird nachgeschärft, aber nicht mehr in diesem Quartal.
Die ruhige Einordnung ist: Google Cloud Next 2026 war nicht der Moment, der den Markt gekippt hat. Es war der Moment, der klar gemacht hat, dass er kippt. Vorstände, die ihre Architektur-Entscheidungen 2026 auf Basis von 2024er Annahmen treffen, landen 2027 im Anpassungs-Modus. Die interessante Führungsaufgabe ist, jetzt eine Position zu beziehen, die in zwölf Monaten noch tragfähig ist.
TPU 8i ist Googles achte Inference-TPU-Generation, angekündigt am 22. April 2026 auf Cloud Next. Sie bündelt 1.152 Chips pro Pod mit dreifachem On-Chip-SRAM. Relevant für Vorstände, weil Inference-Kapazität damit als eigene Einkaufsgröße in IT-Budgets erscheint.
Ein offener Standard für Agent-Kommunikation zwischen unterschiedlichen Providern, den Google auf Cloud Next vorgestellt hat. OpenAI und Anthropic haben Interoperabilitäts-Signale gegeben. Folge: Lock-in-Argumente verschieben sich vom Modell zur Infrastruktur darunter.
Nein. Die Ansage ist nicht Technologie-Wechsel, sondern Vokabel-Check. Boards sollten die Unterscheidung zwischen Training- und Inference-Kapazität beherrschen und eine Position zu Agent-Governance einnehmen. AWS und Azure werden mit eigenen Antworten nachziehen.
Gartners IT-Spending-Prognose 2026 sieht den zweistelligen Prozentsatz des Marktes auf KI laufen. Cloud Next 2026 liefert die Infrastruktur, die diese Budget-Verschiebung operativ macht. Boards, die keine Inference-Linie im Budget haben, werden im Laufe des Jahres nachziehen müssen.
Agent-to-Agent-Kommunikation schafft Haftungs-Szenarien, die DORA und NIS2 nur teilweise decken. Vorstände sollten ihre Legal- und Compliance-Teams beauftragen, Vertragsklauseln für fremde Agenten im eigenen System zu entwerfen, bevor die ersten Produktivfälle auftreten.
Lesetipps der Redaktion
Mehr aus dem MBF Media Netzwerk
Quelle Titelbild: Pexels / Brett Sayles (px:5480781)
Sie müssen den Inhalt von reCAPTCHA laden, um das Formular abzuschicken. Bitte beachten Sie, dass dabei Daten mit Drittanbietern ausgetauscht werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Turnstile. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Facebook. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Instagram. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von X. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr Informationen