Services de sécurité managés : le RSSI n’est pas seul responsable
Benedikt Langer
8 Min. de lecture Dans de nombreuses entreprises, le CISO est perçu comme le responsable de la sécurité. ...
5 Min. Temps de lecture
Le 22 avril 2026, lors de Cloud Next à Las Vegas, Google a présenté la huitième génération de TPU et, pour la première fois, a séparé matériellement l’entraînement et l’inférence. La TPU 8t relie jusqu’à 9 600 puces pour les charges de travail d’entraînement, tandis que la TPU 8i regroupe 1 152 puces par pod d’inférence avec trois fois plus de SRAM sur puce. Parallèlement, la plate-forme Gemini Enterprise Agent a été lancée. Pour les conseils d’administration des conglomérats allemands, ce n’est pas un détail technologique, mais une nouvelle dimension d’achat qui apparaîtra lors du prochain examen des investissements informatiques.
L’essentiel en bref
ApparentéGartner IT-Spending 2026 : 6 150 milliards / Managed Services Build vs. Buy 2026
Le PDG de Google, Sundar Pichai, a présenté trois éléments de produit dans la fenêtre de keynote à 10h00 PST. La huitième génération de TPU est la plus visible, mais pas la plus stratégiquement importante. TPU 8t utilise une nouvelle technologie d’interconnexion inter-puces et relie jusqu’à 9 600 TPU plus deux pétaoctets de mémoire partagée à large bande passante dans un seul superpod. Google parle d’une performance triple par rapport à Ironwood. TPU 8i est le jumeau de l’inférence : 1 152 puces par pod, triple capacité de SRAM sur puce, optimisé pour une faible latence avec des millions de requêtes d’agents parallèles.
Le deuxième élément est la plate-forme Gemini Enterprise Agent. Elle est entrée directement dans la disponibilité générale le 22 avril. Google a indiqué que les revenus de la plate-forme prédécesseur avaient augmenté de 40 % au premier trimestre 2026 avec des utilisateurs actifs mensuels payants. Parallèlement, Accenture et BCG ont annoncé des extensions de partenariat avec le programme d’accélération Gemini Enterprise. Mars utilise la plate-forme pour 150 000 employés. Merck avait déjà annoncé le 22 avril une alliance AI agentic d’un milliard de dollars avec Google Cloud, que nous avons classée ailleurs comme modèle pour les décisions du conseil d’administration.
Le troisième élément, sous-estimé dans les conseils d’administration, est le protocole Agent-to-Agent. Google l’a positionné comme une norme ouverte, OpenAI et Anthropic ont donné des signaux d’interopérabilité. Cela crée un écosystème qui définit la communication entre agents de manière provider-agnostique. Pour la stratégie informatique, cela signifie que les arguments de verrouillage se déplacent du modèle individuel vers la couche d’infrastructure sous-jacente.
Qu’est-ce que TPU 8i ? TPU 8i est la variante d’inférence de la huitième génération de TPU de Google, annoncée le 22 avril 2026 sur Cloud Next. Elle relie 1 152 puces par pod avec une triple capacité de SRAM sur puce par rapport à la génération prédécesseur Ironwood et est explicitement optimisée pour l’exécution parallèle d’agents AI autonomes. La séparation entre l’entraînement (TPU 8t) et l’inférence (TPU 8i) est le signal stratégique : Google traite les deux types de charge de travail comme des produits distincts avec leur propre logique de tarification et de mise à l’échelle.
La demande adressée au conseil d’administration n’est pas d’acheter maintenant une feuille de route Google TPU. Elle consiste à connaître les termes avant que la direction informatique ne pose la question du budget. Trois points doivent être abordés lors de la prochaine réunion du conseil d’administration, quelle que soit la préférence de l’entreprise pour les hyperscalers.
Premièrement : la capacité d’inférence comme taille d’achat distincte. Jusqu’à Cloud Next 2026, de nombreuses équipes informatiques ont calculé l’inférence et la formation ensemble. Google les sépare désormais matériellement. AWS avait déjà différencié Trainium 2 et Inferentia 3 l’année dernière. La conséquence stratégique est que les planifications budgétaires doivent comporter deux chiffres et non un. Celui qui confond cela calcule la capacité de pointe comme charge de base et paie le supplément.
Deuxièmement : construire, acheter ou gérer. Le lancement de l’agent Gemini Enterprise raccourcit considérablement le temps de déploiement des agents. La question du conseil d’administration n’est pas de savoir si « nous voulons construire des agents », mais « construisons-nous nous-mêmes, achetons-nous des agents standard ou louons-nous une voie d’agent géré ». La même distinction qui a été clarifiée en 2025 sur le thème des services gérés se répète maintenant au niveau des agents. Le partenariat BCG avec Google montre où le marché pousse : les bundles de plate-forme plus intégration plus gestion du changement seront le package d’achat standard.
Troisièmement : poser à nouveau les questions de souveraineté. Avec TPU 8i, Google devient technologiquement plus difficile à rattraper. Les fournisseurs de cloud européens qui utilisent des puces NVIDIA doivent concurrencer un hyperscaler intégré sur les prix de l’inférence. Ce n’est pas interdit, mais cela change l’équation économique. Pour les conseils d’administration de la région DACH qui ont besoin de garanties de localisation des données, la décision entre les fournisseurs de l’UE et les hyperscalers sera plus dure et non plus douce.
Un conseil d’administration qui n’a pas de position sur la capacité d’inférence et la gouvernance des agents en 2026 prendra la prochaine décision budgétaire informatique à l’aveugle. Google Cloud Next était le signal que le marché définit justement les questions avant que les réponses ne circulent.
Trois réflexes sont utiles dans les semaines à venir. Premièrement : examiner sa propre feuille de route d’agent. Quiconque utilise actuellement des agents pilotes sur une infrastructure LLM générique devrait poser la question de la capacité productive lors de la prochaine réunion de pilotage. Deuxièmement : documenter la situation contractuelle avec les hyperscalers. Quelles options de sortie sont réalistes deux ans après le déploiement si TPU 8i est devenu la norme ? Troisièmement : activer la conformité tôt. La communication agent à agent soulève des questions de responsabilité qui ne sont pas abordées proprement par DORA ou NIS2. Cela sera affiné, mais pas dans ce trimestre.
L’évaluation calme est que Google Cloud Next 2026 n’a pas été le moment qui a basculé le marché. C’était le moment qui a montré que cela bascule. Les conseils d’administration qui prennent leurs décisions d’architecture en 2026 sur la base d’hypothèses de 2024 atterriront en 2027 en mode d’adaptation. La tâche de leadership intéressante consiste à prendre maintenant une position qui sera encore viable dans douze mois.
TPU 8i est la huitième génération de TPU d’inférence de Google, annoncée le 22 avril 2026 lors de Cloud Next. Elle regroupe 1 152 puces par pod avec trois fois plus de mémoire SRAM sur puce. Elle est pertinente pour les conseils d’administration car la capacité d’inférence apparaît désormais comme une unité d’achat distincte dans les budgets informatiques.
Un standard ouvert pour la communication entre agents de différents fournisseurs, présenté par Google lors de Cloud Next. OpenAI et Anthropic ont donné des signaux d’interopérabilité. Résultat : les arguments de verrouillage se déplacent du modèle vers l’infrastructure sous-jacente.
Non. L’annonce ne concerne pas un changement de technologie, mais une vérification du vocabulaire. Les conseils d’administration devraient maîtriser la distinction entre les capacités de formation et d’inférence et prendre position sur la gouvernance des agents. AWS et Azure suivront avec leurs propres réponses.
La prévision de dépenses informatiques de Gartner pour 2026 voit une proportion importante du marché consacrée à l’IA. Cloud Next 2026 fournit l’infrastructure qui rend cette répartition budgétaire opérationnelle. Les conseils d’administration qui n’ont pas de ligne d’inférence dans leur budget devront la prendre en compte au cours de l’année.
La communication Agent-to-Agent crée des scénarios de responsabilité qui ne sont couverts que partiellement par DORA et NIS2. Les conseils d’administration devraient charger leurs équipes juridiques et de conformité de concevoir des clauses contractuelles pour les agents étrangers dans leur système avant que les premiers cas de production ne surviennent.
Conseils de lecture de la rédaction
Plus de contenu du réseau MBF Media
Source de l’image de titre : Pexels / Brett Sayles (px:5480781)