En bref
L’essentiel en bref
- Le Data Mesh transfère la responsabilité des données des équipes centrales aux services métiers, qui connaissent le mieux leurs données.
- Quatre principes clés : ownership orienté par domaine, les données comme produit, une plateforme en libre-service et une gouvernance fédérée.
- Le Data Mesh résout le problème de scalabilité des équipes data centrales, devenues un goulot d’étranglement pour les décisions data-driven.
- Pour les PME, une approche pragmatique avec deux à trois domaines pilotes est préférable à une refonte complète de l’architecture.
- Le principal obstacle n’est pas technique, mais la volonté organisationnelle de décentraliser la responsabilité des données.
Pendant des années, le data warehouse centralisé a été la référence absolue en matière d’analyse d’entreprise. Puis est arrivé le data lake, censé tout stocker – et qui s’est souvent transformé en
data swamp. Aujourd’hui, le Data Mesh promet de résoudre le problème de fond : qui possède les données, et qui est responsable de leur qualité ?
La réponse du Data Mesh est radicale : ce ne sont pas les équipes IT, mais les services métiers. Le service commercial gère les données commerciales, la production supervise les données de production, les RH s’occupent des données RH. La plateforme centrale ne fournit que l’infrastructure. Pour les PME du DACH (Allemagne, Autriche, Suisse), cette approche est particulièrement prometteuse – à condition de la mettre en œuvre de manière pragmatique.
Pourquoi les équipes data centralisées échouent
Le scénario est le même dans toutes les grandes entreprises : un service métier a besoin d’un nouveau rapport. Il envoie une demande à l’équipe data centralisée. Celle-ci affiche déjà six semaines d’attente. Quand le rapport est enfin prêt, la problématique initiale a évolué. Le
goulot d’étranglement est structurel.
Les équipes data centralisées ne parviennent pas à acquérir assez rapidement le savoir-faire métier indispensable à la création de produits data pertinents. Elles ne maîtrisent pas les données comptables aussi bien que le service comptabilité, ni les données de production aussi bien que le service production. Résultat : incompréhensions, retouches et rapports qui passent à côté de la réalité.
L’approche Data Mesh résout ce problème en transférant la responsabilité là où se trouve l’expertise – directement dans les services métiers.
Comprendre les quatre principes
1. Propriété orientée domaine : Chaque service métier est propriétaire de ses données et en assume la responsabilité. Cela ne signifie pas que chaque service crée son propre entrepôt de données, mais qu’il garantit la qualité, la documentation et la disponibilité de ses données.
2. Les données comme produit : Les données sont traitées comme des produits internes – avec des SLA (accords de niveau de service) définis, une documentation complète, une gestion des versions et des retours utilisateurs. Chaque produit de données dispose d’un Product Owner, responsable de sa qualité et de son évolution.
3. Plateforme de données en libre-service : Une plateforme centrale met à disposition des outils permettant aux services métiers de créer, tester et déployer leurs produits de données de manière autonome. La plateforme masque la complexité technique sous-jacente.
4. Gouvernance fédérée : Les normes transversales en matière d’interopérabilité, de sécurité et de conformité sont définies de manière centralisée, mais leur mise en œuvre est décentralisée. L’équipe de gouvernance établit le cadre, tandis que les domaines le concrétisent.
Une approche pragmatique pour les PME
La version théorique du
Data Mesh suppose un certain niveau de maturité : une culture data solide, des métiers expérimentés et une plateforme performante. La réalité des PME allemandes (et plus largement du Mittelstand, ce tissu d’entreprises de taille intermédiaire qui constitue l’épine dorsale de l’économie DACH) est souvent différente. Voici comment aborder le sujet
de manière pragmatique :
Étape 1 : Identifier deux à trois domaines présentant une forte compétence data et un besoin clair d’améliorer leurs produits data. Les candidats typiques ? Les ventes, la production ou la finance.
Étape 2 : Désigner, pour chaque domaine pilote, un
Data Product Owner – un collaborateur issu du métier, doté d’une appétence pour les données et capable d’y consacrer 20 à 30 % de son temps.
Étape 3 : Définir et déployer un premier produit data par domaine. L’idée ? Démarrer simplement : un jeu de données fiable, bien documenté et exploitable par d’autres services.
Étape 4 : Évaluer après six mois : la qualité des données s’est-elle améliorée ? Les produits sont-ils utilisés ? Où se situent les points de friction ? C’est seulement ensuite qu’il faudra envisager une montée en puissance.
Technologie : ce dont le Data Mesh a réellement besoin
Le Data Mesh n’est pas une décision purement technologique, mais il repose sur des fondements techniques essentiels :
Catalogue de données : Un répertoire central où tous les produits de données sont découvrables, documentés et évaluables. Des outils comme DataHub, Atlan ou Unity Catalog de Databricks remplissent cette fonction.
Contrats de données : Des accords formels entre les producteurs et les consommateurs de données, définissant le format, la qualité et les SLA (accords de niveau de service). Cela évite que des modifications en amont ne perturbent silencieusement les systèmes en aval.
Calcul et stockage : Les plateformes cloud comme Snowflake, Databricks ou BigQuery sont adaptées, car elles prennent en charge nativement le multi-locataire et l’accès en libre-service. Une implémentation
on-premise est possible, mais plus complexe.
À noter :
l’investissement technologique pour un Data Mesh n’est pas plus élevé que pour un entrepôt de données centralisé. Il se répartit simplement différemment – moins de centralisation, davantage d’outils pour la plateforme et l’habilitation des domaines.
Questions fréquentes
Le Data Mesh est-il réservé aux grandes entreprises ?
Non. Le principe fondamental – transférer la responsabilité des données là où se trouve l’expertise – fonctionne dès qu’une entreprise compte environ 100 collaborateurs et trois à quatre domaines métiers clairement délimités. L’ampleur de la mise en œuvre s’adapte à la taille de l’organisation.
Ai-je besoin d’un Data Mesh si je dispose déjà d’un Data Warehouse ?
Data Mesh et Data Warehouse ne s’excluent pas mutuellement. De nombreuses implémentations réussies utilisent un entrepôt de données existant comme couche plateforme, sur laquelle les domaines métiers exposent leurs produits de données. Le Data Mesh représente une évolution organisationnelle, et non un remplacement technique.
Que devient l’équipe Data centrale ?
Elle se transforme en équipe Plateforme. Au lieu de créer elle-même des rapports et des pipelines, elle fournit les outils en libre-service, définit des standards et accompagne les domaines métiers dans le développement de leurs compétences en matière de données. Son rôle ne perd pas en importance, il évolue.
Comment garantir la qualité des données lorsque les domaines métiers en sont responsables ?
Grâce à trois mécanismes : les contrats de données (Data Contracts) définissent formellement les attentes en matière de qualité. Des contrôles automatisés de la qualité des données, intégrés à la plateforme, vérifient chaque livraison de données. Enfin, des métriques de qualité transparentes dans le catalogue de données créent des incitations à produire des données de qualité – personne ne souhaite fournir le produit affichant les pires évaluations.
Combien de temps prend l’implémentation d’un Data Mesh ?
Les premiers domaines pilotes peuvent être opérationnels en trois à six mois. Un déploiement à l’échelle de l’entreprise prend généralement entre 18 et 24 mois. Le facteur de succès le plus important n’est pas la technologie, mais la volonté de l’organisation de réellement décentraliser les responsabilités.
Source de l’image d’en-tête : Unsplash / JJ Ying
Pour aller plus loin