SaaS-Portfolios brauchen eine Exit-Strategie, kein nächstes Tool
Eva Mickler
7 Min. Lesezeit Die einfachen SaaS-Konsolidierungen sind durch. Wer doppelte Tools streichen wollte, ...
Am 8. April 2026 hat Gartner eine Prognose veröffentlicht, die für CIOs direkte Budget-Konsequenzen hat: Der weltweite Halbleiterumsatz überschreitet 2026 erstmals die 1,3-Billionen-Dollar-Marke – ein Wachstum von 64 Prozent gegenüber dem Vorjahr. Der Treiber ist bekannt. Die Konsequenz für IT-Budgets ist es weniger.
5 Min. Lesezeit
Ein 1,3-Billionen-Dollar-Markt klingt nach Macro-Statistik. Ist es nicht. Halbleiter sind die Zulieferer-Kette hinter jedem Server, jedem Notebook, jedem Storage-Array und jeder GPU-Instanz, die CIOs einkaufen. Was in dieser Branche passiert, landet mit 12 bis 18 Monaten Verzögerung in den Preislisten von Dell, HPE, Lenovo und in den Cloud-Spot-Preisen der Hyperscaler.
Das konkrete Problem für 2026 und 2027: Gartner nennt das Phänomen Memflation. DRAM-Preise steigen um 125 Prozent, NAND-Flash um 234 Prozent. Beide sind Kernkomponenten in nahezu jedem Gerät. Endkunden-Preise für Hardware werden folgen – mit Verzögerung, aber sie werden folgen.
CIOs die 2026 Refresh-Zyklen für Server-Infrastructure oder Endgeräte-Flotten geplant haben, sollten die Timing-Annahmen überprüfen. Wer jetzt kauft, kauft vor dem Preisanstieg. Wer auf 2027 wartet, kauft in einem Memory-Markt ohne Entlastung.
AI-Semiconductors sind 30 Prozent des Gesamt-Halbleitermarkts – und sie sind knapp. AWS, Microsoft, Google und Meta binden mit Multi-Milliarden-Commitments die verfügbare GPU-Kapazität der nächsten zwei bis drei Quartale. NVIDIA, AMD und Custom-Chip-Hersteller priorisieren diese Abnehmer.
Für Unternehmen die GPU-Kapazität für eigene KI-Workloads brauchen ergeben sich zwei realistische Szenarien.
Cloud-first: GPU-Kapazität über AWS, Azure oder GCP mieten statt kaufen. Kein Beschaffungs-Vorlauf, keine Abschreibungs-Risiken. Aber: Cloud-Spot-Preise für A100- und H100-Instanzen sind 2026 ebenfalls gestiegen, weil Hyperscaler die Knappheit weitergeben.
On-Prem mit langem Vorlauf: Wer physische GPU-Server plant, rechnet aktuell mit 12 bis 20 Wochen Beschaffungszeit. Das ist kein Problem wenn das Projekt in neun Monaten startet. Es ist ein Problem wenn das Board die KI-Initiative für Q3 2026 angesetzt hat.
Einordnung
64% Halbleiter-Wachstum 2026. Hyperscaler-Infra-Spending: mehr als +50%. KI-Chips: 30% des Gesamtmarkts.
Quelle: Gartner, 8. April 2026
1. Hardware-Refresh mit 15-25% Puffer kalkulieren. Memflation bei DRAM und NAND erhöht die Einstandspreise für Server, Storage und Endgeräte bis Ende 2026 und 2027. Wer mit Vorjahres-Preislisten plant, wird Nachgenehmigungen brauchen.
2. KI-Workload-Timing mit Beschaffungs-Reality abgleichen. Wenn ein KI-Pilot im Q3 2026 Hardware braucht, muss die Bestellung jetzt laufen. Lead-Times von 12 bis 20 Wochen für GPU-Hardware sind 2026 Standard – kein Ausnahme-Zustand.
3. Cloud-Budget für GPU-Kapazität realistisch erhöhen. Wer On-Prem-GPU durch Cloud-Spot-Kapazität ersetzt, braucht einen Puffer. Gartner-Daten zeigen Korrelation zwischen Hardware-Markt und Cloud-Pricing für KI-Instanzen.
Die Gartner-Prognose liefert keine neuen Probleme. Sie liefert Zahlen für Probleme, die CIOs bereits kennen. Der Wert: Board-Gespräche über Hardware-Budget-Anpassungen mit externer Referenz unterfüttern.
Beides, aber mit unterschiedlichem Timing. Cloud-Provider amortisieren Hardware-Kosten über mehrere Jahre und absorbieren kurzfristig einen Teil selbst. Mittelfristig – Gartner sieht realistischere Memory-Preise frühestens Ende 2027 – werden höhere Einstandspreise in Compute- und Storage-Tarife eingepreist. Im 2027-Budget-Forecast sollte man mit 10 bis 20 Prozent Preiserhöhungen bei Memory-intensiven Cloud-Instanzen rechnen.
Ja, mit Einschränkungen. AMD Instinct MI300X ist verfügbar und für Inferenz-Workloads kompetitiv. Für Training auf großen Modellen ist das NVIDIA-Ökosystem (CUDA, Toolchain) noch deutlich reifer. Custom-AI-Chips über Cloud-Provider (AWS Trainium2, Google TPU v5) sind interessant für spezifische Workloads, binden aber stark an einen Provider. Für erste Unternehmens-KI-Projekte gilt: Die meisten Workloads laufen auf Inferenz – dort sind die Alternativen zu NVIDIA realer als oft angenommen.
Für das laufende Jahr historisch zuverlässig (Abweichungen unter 10 Prozent), weil ein Großteil der Kapazität bereits vertraglich gebunden ist. Die 64-Prozent-Wachstumsrate ist außergewöhnlich, aber durch konkrete Order-Backlogs bei NVIDIA, TSMC und SK Hynix belegt. Das eigentliche Risiko ist kein Downside-Risiko, sondern ein Supply-Risiko: Wenn TSMC-Kapazitäten knapper werden als erwartet, steigen die Preise weiter.
Quelle Titelbild: Pexels / Brett Sayles (px:5050305)
Sie müssen den Inhalt von reCAPTCHA laden, um das Formular abzuschicken. Bitte beachten Sie, dass dabei Daten mit Drittanbietern ausgetauscht werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Turnstile. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Facebook. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Instagram. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von X. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr Informationen