24.04.2026

5 Min. Lesezeit

Google hat am 22. April 2026 auf Cloud Next in Las Vegas die achte TPU-Generation vorgestellt und dabei erstmals Training und Inference hardwareseitig getrennt. TPU 8t vernetzt bis zu 9.600 Chips für Training-Workloads, TPU 8i bündelt 1.152 Chips pro Inference-Pod mit dem dreifachen On-Chip-SRAM. Parallel ging die Gemini Enterprise Agent Platform live. Für Vorstände deutscher Konzerne ist das kein Technologie-Detail, sondern eine neue Einkaufs-Dimension, die im nächsten IT-Investitions-Review auftauchen wird.

Das Wichtigste in Kürze

  • Inference-Kapazität wird Einkaufsgröße. TPU 8i bündelt 1.152 Chips pro Pod, dreimal mehr SRAM als Ironwood, optimiert für parallele Agent-Ausführung.
  • Agentic-Infrastruktur wird Commodity. Gemini Enterprise Agent Platform live seit 22.04. Accenture, BCG, Mars und Merck als Referenz-Kunden. Der Markt öffnet sich schneller als viele Boards planen.
  • Vorstandsfrage ab sofort: Inference-Skalierung oder Zuliefererrisiko. Wer TPU 8i und A2A-Protocol nicht kennt, kann keine belastbare Zusage zur Produktiv-Skalierung geben.

VerwandtGartner IT-Spending 2026: 6.150 Milliarden  /  Managed Services Build vs. Buy 2026

Was Sundar Pichai am 22. April konkret angekündigt hat

Google-CEO Sundar Pichai hat im Keynote-Fenster 10:00 PST drei Produkt-Bausteine vorgestellt. Die TPU-8-Generation ist der sichtbarste, aber nicht der strategisch wichtigste. TPU 8t verwendet eine neue Inter-Chip-Interconnect-Technologie und verknüpft bis zu 9.600 TPUs plus zwei Petabyte Shared-High-Bandwidth-Memory in einem einzigen Superpod. Google spricht von dreifacher Leistung gegenüber Ironwood. TPU 8i ist der Inference-Zwilling: 1.152 Chips pro Pod, dreifache On-Chip-SRAM-Kapazität, optimiert für niedrige Latenz bei Millionen parallelen Agent-Requests.

Der zweite Baustein ist die Gemini Enterprise Agent Platform. Sie ging am 22. April direkt in die allgemeine Verfügbarkeit. Google hat den Umsatz der Vorgänger-Plattform im ersten Quartal 2026 mit plus 40 Prozent paid-Monthly-Active-Users quartalsweise angegeben. Parallel haben Accenture und BCG Partnerschafts-Erweiterungen zum Gemini Enterprise Acceleration Program gemeldet. Mars nutzt die Plattform für 150.000 Mitarbeitende. Merck hatte bereits am 22. April eine eigene Eine-Milliarde-Dollar-Agentic-AI-Allianz mit Google Cloud angekündigt, die wir an anderer Stelle als Template für Vorstandsentscheidungen eingeordnet haben.

Der dritte Baustein, der in Boards unterschätzt wird, ist das Agent-to-Agent-Protocol. Google hat es als offenen Standard positioniert, OpenAI und Anthropic haben Interoperabilitäts-Signale gegeben. Damit entsteht ein Ökosystem, das Agent-Kommunikation provider-übergreifend definiert. Für die IT-Strategie heißt das: Lock-in-Argumente verschieben sich vom einzelnen Modell zur Infrastruktur-Schicht darunter.

1.152
TPU 8i Chips pro Inference-Pod, dreifacher On-Chip-SRAM gegenüber Vorgänger Ironwood. Ziel: Millionen konkurrierender Agenten mit niedriger Latenz kosteneffizient ausführen.
Quelle: Google Cloud Next 2026 Keynote, 22.04.2026

Was ist TPU 8i? TPU 8i ist die Inference-Variante der achten Google-TPU-Generation, angekündigt am 22. April 2026 auf Cloud Next. Sie verbindet 1.152 Chips pro Pod mit dreifachem On-Chip-SRAM gegenüber der Vorgänger-Generation Ironwood und ist explizit für die parallele Ausführung autonomer KI-Agenten optimiert. Die Trennung zwischen Training (TPU 8t) und Inference (TPU 8i) ist das strategische Signal: Google behandelt die beiden Workload-Typen als eigenständige Produkte mit eigener Preis- und Skalierungslogik.

Drei Vorstandsfragen für das nächste IT-Investitions-Review

Die Ansage an den Vorstand ist nicht, jetzt eine Google-TPU-Roadmap zu kaufen. Sie ist, die Vokabeln zu kennen, bevor die IT-Leitung die Budgetfrage stellt. Drei Punkte gehören in die nächste Board-Sitzung, unabhängig davon, welche Hyperscaler-Präferenz das Unternehmen hat.

Erstens: Inference-Kapazität als eigene Einkaufsgröße. Bis Cloud Next 2026 haben viele IT-Teams Inference und Training zusammengerechnet. Google trennt das jetzt hardwareseitig. AWS hatte bereits im vergangenen Jahr Trainium 2 und Inferentia 3 ausdifferenziert. Die strategische Konsequenz: Budgetplanungen müssen zwei Zahlen führen, nicht eine. Wer das verwechselt, kalkuliert Peak-Kapazität als Basislast und zahlt den Aufschlag.

Zweitens: Build, Buy oder Managed. Der Gemini-Enterprise-Agent-Launch verkürzt die Time-to-Deployment für Agenten dramatisch. Die Vorstandsfrage ist nicht „wollen wir Agenten bauen“, sondern „bauen wir selbst, kaufen wir Standard-Agenten, oder mieten wir eine Managed-Agent-Lane“. Die gleiche Unterscheidung, die 2025 beim Thema Managed Services bereits geklärt wurde, kehrt jetzt auf Agenten-Ebene wieder. Die BCG-Partnerschaft mit Google zeigt, wohin der Markt drückt: Bundles aus Plattform plus Integration plus Change-Management werden das Einkaufs-Standardpaket.

Drittens: Souveränitäts-Fragen neu stellen. Mit TPU 8i wird Google technologisch schwieriger einholbar. Europäische Cloud-Provider, die auf NVIDIA-Chips sitzen, müssen bei Inference-Preisen mit einem integrierten Hyperscaler konkurrieren. Das ist nicht verboten, aber es ändert die ökonomische Gleichung. Für DACH-Vorstände, die Datenstandort-Garantien brauchen, wird die Entscheidung zwischen EU-Provider und Hyperscaler härter, nicht weicher.

Ein Vorstand, der 2026 keine Position zu Inference-Kapazität und Agent-Governance hat, trifft die nächste IT-Budget-Entscheidung blind. Google Cloud Next war das Signal, dass der Markt gerade die Fragen definiert, bevor die Antworten kursieren.

Was das konkret für deutsche Boards bedeutet

Drei Reflexe sind in den nächsten Wochen nützlich. Erstens: die eigene Agent-Roadmap prüfen. Wer aktuell Pilot-Agenten auf generischer LLM-Infrastruktur fährt, sollte im nächsten Lenkungskreis die Frage nach Produktiv-Kapazität stellen. Zweitens: die Vertragslage gegenüber Hyperscaler dokumentieren. Welche Exit-Optionen sind zwei Jahre nach Roll-out realistisch, wenn TPU 8i der Standard geworden ist? Drittens: Compliance früh einschalten. Agent-to-Agent-Kommunikation wirft haftungsrechtliche Fragen auf, die weder DORA noch NIS2 sauber adressieren. Das wird nachgeschärft, aber nicht mehr in diesem Quartal.

Die ruhige Einordnung ist: Google Cloud Next 2026 war nicht der Moment, der den Markt gekippt hat. Es war der Moment, der klar gemacht hat, dass er kippt. Vorstände, die ihre Architektur-Entscheidungen 2026 auf Basis von 2024er Annahmen treffen, landen 2027 im Anpassungs-Modus. Die interessante Führungsaufgabe ist, jetzt eine Position zu beziehen, die in zwölf Monaten noch tragfähig ist.

Häufige Fragen

Was ist TPU 8i und warum ist sie für Vorstände relevant?

TPU 8i ist Googles achte Inference-TPU-Generation, angekündigt am 22. April 2026 auf Cloud Next. Sie bündelt 1.152 Chips pro Pod mit dreifachem On-Chip-SRAM. Relevant für Vorstände, weil Inference-Kapazität damit als eigene Einkaufsgröße in IT-Budgets erscheint.

Was ist das Agent-to-Agent-Protocol?

Ein offener Standard für Agent-Kommunikation zwischen unterschiedlichen Providern, den Google auf Cloud Next vorgestellt hat. OpenAI und Anthropic haben Interoperabilitäts-Signale gegeben. Folge: Lock-in-Argumente verschieben sich vom Modell zur Infrastruktur darunter.

Müssen wir jetzt auf Google umsteigen?

Nein. Die Ansage ist nicht Technologie-Wechsel, sondern Vokabel-Check. Boards sollten die Unterscheidung zwischen Training- und Inference-Kapazität beherrschen und eine Position zu Agent-Governance einnehmen. AWS und Azure werden mit eigenen Antworten nachziehen.

Wie steht das im Verhältnis zu Gartners 6.150-Milliarden-Prognose?

Gartners IT-Spending-Prognose 2026 sieht den zweistelligen Prozentsatz des Marktes auf KI laufen. Cloud Next 2026 liefert die Infrastruktur, die diese Budget-Verschiebung operativ macht. Boards, die keine Inference-Linie im Budget haben, werden im Laufe des Jahres nachziehen müssen.

Welche Compliance-Fragen sollten jetzt geklärt werden?

Agent-to-Agent-Kommunikation schafft Haftungs-Szenarien, die DORA und NIS2 nur teilweise decken. Vorstände sollten ihre Legal- und Compliance-Teams beauftragen, Vertragsklauseln für fremde Agenten im eigenen System zu entwerfen, bevor die ersten Produktivfälle auftreten.

Quelle Titelbild: Pexels / Brett Sayles (px:5480781)

Diesen Beitrag teilen:
Auch verfuegbar inEnglisch  ·  Franzoesisch  ·  Spanisch

Auch verfügbar in

Weitere Beiträge

18.05.2026

SaaS-Portfolios brauchen eine Exit-Strategie, kein nächstes Tool

Eva Mickler

7 Min. Lesezeit Die einfachen SaaS-Konsolidierungen sind durch. Wer doppelte Tools streichen wollte, ...

Zum Beitrag
17.05.2026

Souveränität schlägt Preis: das neue Vergabe-Signal

Angelika Beierlein

8 Min. Lesezeit Der Bund will seine zentrale Verwaltungscloud von SAP und der Deutschen Telekom bauen ...

Zum Beitrag
16.05.2026

Welches IT-Budget die Kürzungsrunde überlebt

Angelika Beierlein

7 Min. Lesezeit Die Budget-Runde für 2027 läuft. Das IT-Budget wird darin wieder als Kostenposition ...

Zum Beitrag
15.05.2026

Wer im Konzern definiert, was die KI für wahr hält

Eva Mickler

7 Min. Lesezeit Microsoft lässt Administratoren seit April bestimmte SharePoint-Sites als autoritative ...

Zum Beitrag
15.05.2026

Agent 365 ordnet die KI-Agenten, die Haftung bleibt offen

Angelika Beierlein

7 Min. Lesezeit Microsoft hat mit Agent 365 seit dem 1. Mai eine Kontrollebene für KI-Agenten im Markt. ...

Zum Beitrag
14.05.2026

Post-Quantum-Kryptographie: Der Countdown für die Konzern-IT läuft

Bernhard Liebl

7 Min. Lesezeit · Strategie-Briefing Die Post-Quantum-Diskussion verlässt 2026 die Forschungsabteilung ...

Zum Beitrag
Ein Magazin der Evernine Media GmbH