La stratégie de données simplifiée – Les 7 dimensions de la stratégie de données

Quels sont les sujets que vous devez aborder pour concevoir une stratégie de données efficace et pourquoi.

Une simple déclaration d’une ligne suffit à définir une stratégie de données, MAIS ce n’est que le début de l’histoire. Toutes les dimensions de la stratégie de données doivent être abordées de manière spécifique et détaillée.

Alors, quelles sont ces dimensions ?

Eh bien, cela dépend de la façon dont vous comprenez la portée de la stratégie de données. Certaines entreprises abordent la stratégie des données comme un sujet de Business Intelligence. D’autres se concentrent uniquement sur les aspects de gouvernance. Certaines pensent que la stratégie en matière de données concerne le Big Data et la création d’un lac de données. D’autres pensent que la stratégie en matière de données concerne l’intelligence artificielle. Je pourrais poursuivre cette liste et fournir de nombreux autres exemples.

Ce que cette liste montre en fait, c’est une conception erronée de la portée réelle de la stratégie en matière de données.

Une stratégie de données se traduira par une série d’actions, d’activités, de programmes, de projets et d’initiatives visant à mettre en place un écosystème de données répondant à tous les défis de la stratégie de données. Ainsi, se concentrer sur une seule partie de cet écosystème de données limitera la portée et la valeur de votre stratégie de données. Par exemple, focaliser une stratégie de données uniquement sur les questions analytiques engendrera des risques liés à la pérennité des insights produits par les projets ou initiatives analytiques si la question de la qualité des données n’est pas traitée correctement. Autre exemple : en se concentrant uniquement sur la gouvernance des données, vous vous assurerez que vos actifs de données sont bien gérés et organisés, mais pas nécessairement que de la valeur est créée à partir de ces actifs.

Ce dont nous avons besoin, c’est d’avoir une compréhension claire de ce qu’est un écosystème de données pour pouvoir définir les dimensions d’une stratégie de données. À mon avis, et dans le contexte de la stratégie de données,

L’écosystème de données est un ensemble d’éléments fonctionnels, technologiques et humains permettant de gérer le cycle de vie des données et de créer de la valeur à partir des actifs de données.

Cet écosystème de données n’est qu’une partie de l’ensemble des éléments constituant toute organisation. Il interagit avec l’écosystème financier, l’écosystème informatique, l’écosystème commercial, etc. C’est un peu comme un gigantesque puzzle où chaque pièce fait partie d’un écosystème spécifique et est liée à toutes les autres parties de l’organisation.

En examinant les éléments fonctionnels, technologiques et humains nécessaires pour gérer le cycle de vie des données et créer de la valeur à partir des actifs de données, je suggère de se concentrer sur les dimensions suivantes :

  • Gouvernance : politiques, principes, règles, procédures, normes.
  • Organisation : fonctions, rôles et responsabilités
  • Architecture : environnement technologique, infrastructure, outils
  • Création de valeur : cas d’utilisation, exploitation, consommation

Ces dimensions constituent une base solide pour commencer à élaborer une stratégie en matière de données. Les entreprises qui ont conçu des stratégies de données basées sur ces 4 dimensions seront en mesure de créer de la valeur à partir de leurs actifs de données. On peut toutefois se demander si elles réussiront à créer de la valeur à partir de leurs actifs de données sur le long terme.

En 2017 déjà, Gartner affirmait que 85 % des projets de big data avaient échoué. Comme c’est souvent le cas avec les chiffres provenant de Gartner, ces 85% ont depuis été fortement réutilisés et étendus aux projets de données au sens large et pas seulement aux projets Big Data. La raison pour laquelle personne n’a vraiment remis en question ce chiffre et la façon dont il est utilisé est que la plupart des praticiens des données sur le marché pensent qu’il est correct. D’après mon expérience, les initiatives et les projets de données sont en effet difficiles à faire aboutir. Je ne dirais pas que 85 % de ces projets échouent. Ce que je dirais en revanche, c’est qu’au moins 85 % des projets de données ne répondent pas aux attentes initiales.

L’une des principales raisons de cette situation est liée à la définition inadéquate ou à l’absence de définition d’une stratégie de données globale et holistique. Pour être clair, les 4 dimensions ci-dessus ne sont pas suffisantes. Elles doivent être complétées par :

  • Vision : une vue d’ensemble claire de l’objectif des données au sein de l’entreprise ( la déclaration en une phrase )
  • La culture : la capacité de l’entreprise à intégrer et à utiliser les données dans le processus décisionnel.
  • Compétences : les compétences et les connaissances analytiques, techniques et de pensée critique nécessaires aux employés à tous les niveaux de l’entreprise.

Ce sont ces 7 dimensions qu’il faut prendre en compte pour concevoir la bonne stratégie en matière de données et construire un écosystème de données solide.

Ne pas les aborder toutes ou ne se concentrer que sur une sélection d’entre elles créera inévitablement des trous dans le puzzle global.

 

1. VISION

Commençons par le commencement :

  • Quel est l’objectif des données dans votre organisation ?
  • Quelle est leur importance ?
  • Quel est son lien avec les objectifs stratégiques de l’entreprise ?
  • Les besoins en données des utilisateurs professionnels sont-ils pris en compte ?

Ce sont là quelques-unes des questions auxquelles il faut répondre afin d’élaborer la bonne vision. N’oubliez pas qu’une vision doit donner un aperçu clair de la finalité des données au sein de l’entreprise. D’ailleurs, cette vision n’est pas coulée dans le béton. Elle peut évoluer au fil du temps. Une vision peut être à court et/ou à long terme.

Les sections ci-dessous présentent quelques caractéristiques clés des dimensions 2 à 7.

2. CRÉATION DE VALEUR

Comment créer de la valeur avec des données ? Il existe de nombreuses réponses à cette question. Pour des raisons de simplicité, je n’utiliserai que 3 catégories pour commencer :

– Business Intelligence : la valeur est créée à partir de la capacité à transformer les données en informations de gestion.

– Analytique et IA : la valeur est créée à partir de la capacité d’analyser les données pour produire des informations exploitables.

– Monétisation : la valeur est créée à partir de la capacité à vendre des données.

Pas de texte alt fourni pour cette image
Pour aborder pleinement cette dimension, il sera nécessaire de se concentrer sur l’identification et la hiérarchisation des cas d’utilisation, la distinction entre les différents types de BI (opérationnelle, tactique, stratégique), la distinction entre l’analyse des données et l’analytique avancée, la démystification de l’intelligence artificielle, entre autres.

3. ORGANISATION

Qui est en charge de quoi lorsqu’il s’agit de données ? Les rôles et les responsabilités sont-ils clairement définis et compris ? De combien de personnes avons-nous réellement besoin ? Notre organisation est-elle adaptée aux besoins ? Quel est l’équilibre des pouvoirs en matière de données ?

En fonction des objectifs fixés pour la stratégie de données et de la maturité de l’entreprise en matière de données, le choix du modèle opérationnel et des rôles et responsabilités associés aura un impact significatif sur la capacité de l’entreprise à déployer efficacement sa stratégie de données. Un modèle centralisé peut être le choix le plus approprié pour une entreprise et le plus néfaste pour une autre. Que vous optiez pour un modèle centralisé, décentralisé ou hybride, le choix doit être adapté aux besoins et à la nature spécifiques d’une entreprise donnée.

Il en va de même pour les rôles et les responsabilités. Que l’organisation soit composée d’un Chief Data Officer, d’un Chief Analytics Officer, de data scientists, d’analystes de données, d’ingénieurs de données, d’architectes de données, de data DevOps, d’un responsable de la gouvernance des données, d’un responsable de la qualité des données, de responsables de domaines d’information, de responsables de domaines de données, etc… dépendra des besoins et de la nature spécifiques d’une entreprise donnée.

Je ne suis pas un grand fan de l’approche de « l’armée mexicaine » avec trop de rôles et trop de personnes. Je ne suis pas non plus un grand fan des approches avec trop peu de ressources. Malheureusement, ces deux types d’approches se retrouvent trop souvent dans des entreprises qui n’ont pas pleinement saisi la complexité de la gestion des données en tant qu’actif. Et oui, il est possible d’avoir trop de rôles. Cela se produit lorsque des entreprises décident d’investir dans les données sans approche coordonnée ni stratégie bien définie. Des initiatives et des projets surgissent dans différents secteurs de l’entreprise et peuvent entrer en concurrence avec l’approche « officielle ». Dans ces cas, la Shadow BI et la Shadow Analytics deviennent une réalité et créent une confusion importante sur les rôles et les responsabilités.

Il y a tellement plus à dire que ces quelques lignes, je détaillerai donc cette section dans un prochain article.

4. GOUVERNANCE

Quels sont vos actifs de données ? :

  • Où se trouvent-elles ? Qui est responsable de ces actifs ?
  • Comment sont-ils définis ?
  • Comment interagissent-ils ?
  • Quelles sont les règles qui régissent la gestion, l’utilisation et l’exploitation de ces actifs ?
  • Pouvez-vous garantir la qualité de vos actifs de données ?

Il ne fait aucun doute que la gouvernance des données est essentielle à la réussite d’une stratégie de données. Et pourtant, de nombreuses entreprises ne sont pas claires sur les objectifs de la gouvernance des données ou n’y investissent pas.

Pour de nombreuses entreprises, investir dans l’analyse des données, le Big Data, la science des données, l’IA est presque une évidence. Même si elles n’ont pas toutes une vision claire des cas d’utilisation qu’elles veulent aborder. Mais lorsqu’il s’agit de gouvernance des données, les débats sont plus nombreux. La raison en est que les avantages de la gouvernance des données ne sont pas immédiatement compris.

Pourquoi une entreprise devrait-elle investir dans des activités qui créent davantage de charge de travail, de procédures, de règles et de politiques ?

La gouvernance des données n’est pas sexy – désolé pour mes collègues de la gouvernance des données – nous le savons. Mais elle est essentielle, et il est grand temps que toutes les entreprises travaillant avec des données la comprennent. Nous connaissons tous les risques liés à l’utilisation de données mal définies, de mauvaise qualité ou non nettoyées. Nous savons tous qu’il est important d’avoir un langage commun dans une entreprise. Nous savons tous que pour que nos analyses soient fiables et durables, nous devons faire confiance à nos données.

Un exemple très simple : une entreprise a investi plusieurs mois dans un projet de science des données pour extraire des variables de jeux de données non structurés. Des algorithmes avec des taux de réussite élevés ont été produits et le personnel opérationnel était impatient d’utiliser ces résultats au quotidien. Lorsque le moment est venu d’industrialiser, les problèmes de qualité, de traçabilité et d’accessibilité des données ont nécessité des investissements supplémentaires non planifiés. Tous ces problèmes auraient pu être résolus si un cadre approprié de gouvernance des données avait été établi au préalable.

5. ARCHITECTURE

Cette dimension est tellement intéressante. Chaque fois que je pense l’avoir comprise, quelque chose de nouveau arrive et change la donne. Pour que les choses soient claires, je ne suis pas un vrai informaticien. J’ai étudié l’économie internationale, la finance et la politique. Je suis entré dans le monde de l’informatique dans les années 2000 en tant que responsable financier de programmes stratégiques de plus de 500 millions d’euros. Après un an à ce poste, le DSI m’a proposé de créer une équipe chargée d’analyser les dépenses des programmes informatiques. C’est ainsi que je suis entré dans le monde de l’informatique et que j’ai commencé à l’apprendre.

Tout ce que je sais de l’informatique, je l’ai appris sur le terrain. Il en va de même pour l’architecture des données. Et ce que je sais maintenant de l’architecture des données, c’est qu’il existe différentes définitions de ce qu’elle recouvre. Pour certains, l’architecture des données concerne les modèles, qu’ils soient conceptuels, physiques ou logiques. L’architecture des données est considérée comme la manière dont les données proviennent des systèmes sources, sont modélisées, sont reliées entre elles et alimentent les systèmes applicatifs. Pour d’autres, l’architecture des données se concentre sur les environnements technologiques permettant le cycle de vie des données.

Pour ma part, l’architecture des données concerne tout cela et bien plus encore. L’architecture des données concerne en effet les modèles, l’infrastructure, les plateformes, le cycle de vie des données, les applications et les outils. Et c’est aussi le moteur de la création de valeur des données. Pour être efficace et adaptée à son objectif, une architecture de données doit être alignée sur les besoins des utilisateurs professionnels. Dans le domaine des données, les entreprises et l’informatique doivent agir comme de véritables partenaires commerciaux.

J’approfondirai ce sujet dans un prochain article, en utilisant une approche commerciale et en faisant de mon mieux pour éviter le jargon technique.

6. CULTURE

Tout d’abord, pourquoi est-ce que je distingue la culture de la compétence alors que beaucoup d’autres les mettent ensemble ? Si l’on considère que la culture est la capacité d’une entreprise à intégrer et à utiliser des données dans le processus de prise de décision, nous devons mieux comprendre ce qu’est cette capacité. Le dictionnaire de Cambridge définit l’aptitude comme étant le pouvoir ou la compétence nécessaire pour faire quelque chose, ou le fait que quelqu’un soit capable de faire quelque chose. Nous savons qu’une capacité peut être apprise ou innée. De même, la culture des données est la combinaison de différents facteurs impliquant les habitudes, l’état d’esprit, la culture d’entreprise, la maturité des données, le profil des employés et la nature de l’activité.

Ainsi, je dirais que certaines entreprises, en raison de leur nature et de leur profil même, font déjà preuve d’une culture des données bien développée, même si leur maîtrise des données n’est pas optimale. Certaines entreprises sont capables d’intégrer et d’utiliser des données dans leur processus décisionnel, sans pour autant être des experts dans ce domaine et commettre des erreurs. Dans ce cas, la question est de savoir si la culture des données leur est utile. À long terme, oui, mais cela ne changera pas leur culture des données. Pour eux, l’objectif devrait être de maintenir et d’entretenir cette culture des données existante. Pour les autres entreprises qui luttent contre la culture des données, la formation aux données sera essentielle dans leur processus d’habilitation.

 

7. COMPETENCE

Votre personnel possède-t-il les bonnes compétences en matière de données ? Qui doit savoir quoi ? Quelles sont les compétences spécifiques requises pour un personnage donné ? Quel est le niveau de compétence requis pour une fonction donnée ?

La maîtrise des données vise à apporter le bon contenu aux bonnes personnes avec les bonnes compétences, en assurant un traitement correct des questions liées aux données. La maîtrise des données englobe les compétences et les connaissances analytiques, techniques et de réflexion critique dont ont besoin les employés à tous les niveaux de votre entreprise.

En offrant aux employés la possibilité d’acquérir le bon ensemble de compétences pour gérer et exploiter les données, les entreprises augmenteront leur capacité à exploiter le plein potentiel de leurs actifs de données. Pourquoi ? Parce que les employés à tous les niveaux seront en mesure de comprendre et de relever les défis liés aux données en toute connaissance de cause, ce qui limitera le risque d’actions inadéquates, d’échec des projets et d’opportunités manquées.

En résumé :

Un écosystème de données est un ensemble d’éléments fonctionnels, technologiques et humains permettant de gérer le cycle de vie des données et de créer de la valeur à partir des actifs de données.

Il y a 7 dimensions qui doivent être abordées pour concevoir la bonne stratégie de données et construire un écosystème de données solide. Ne pas les aborder toutes ou ne se concentrer que sur une sélection d’entre elles créera inévitablement des trous dans le puzzle global.

Les dimensions sont :

  1. Vision : une vue d’ensemble claire de l’objectif des données au sein de l’entreprise.
  2. Création de valeur : cas d’utilisation, exploitation, consommation
  3. Organisation : fonctions, rôles et responsabilités
  4. Gouvernance : politiques, principes, règles, procédures, normes
  5. Architecture : environnement technologique, infrastructure, outils
  6. Culture : la capacité d’une entreprise à intégrer et à utiliser les données dans le processus décisionnel
  7. Compétence : compétences et connaissances analytiques, techniques et de pensée critique nécessaires aux employés à tous les niveaux de l’entreprise.

La vision avec une déclaration d’une ligne n’est que le début de l’histoire. La vraie difficulté vient de la définition des autres dimensions de votre stratégie de données. Si vous n’abordez pas toutes les dimensions, vous créerez inévitablement un écosystème de données déséquilibré, qui générera à son tour des inefficacités, des problèmes et un potentiel de valeur des données manqué.

Bienvenue au casse-tête de la stratégie des données …

 

Discutons de votre projet ensemble