Généralisation du concept de la donnée

Qu’est-ce que la donnée ?

Que l’on soit expert ou néophyte, il est important d’appréhender l’élément fondamental de notre sujet: la donnée. Je vous propose de démarrer par sa définition : Qu’est-ce que la donnée ?

Quand on regarde les différentes définitions dans les dictionnaires et plateformes de partage de savoir, la définition commune à tous est la suivante :

Elément indiscutable sur lequel on peut fonder un raisonnement, qui est le point de départ d’une recherche

La donnée est donc un élément objectif, ce qui lui permet d’être la base d’un raisonnement ou le point de départ d’une recherche.

Quelques exemples

Pour illustrer cela, prenons un premier exemple du quotidien : le thermomètre. Il nous indique la température à un instant et en un lieu. Nous pouvons qualifier cette température lue comme une donnée : elle n’est pas contestable, ce n’est pas une interprétation, ni un jugement ; elle est objective. Puis, à partir de cette température (ou donnée), nous pouvons créer un raisonnement : si elle est au-dessus de 25°C, alors il faut s’habiller légèrement, et si elle est en dessous de 5°C, il faut s’habiller chaudement. 

Prenons un autre exemple pour approfondir l’illustration : une enquête de police. Un crime a été commis, les enquêteurs relèvent des indices (ou données) : l’heure de découverte, les empreintes digitales, le lieu, etc. A partir de ces indices, il vont élaborer des raisonnements pour mener une recherche afin d’élucider cette affaire.

Problématiques liées à la donnée et à son exploitation

A partir des 2 exemples précédents, on peut déjà mettre en lumière les principales problématiques liées à la donnée et à son exploitation.

La qualité de la donnée

    • Est-ce que le thermomètre fonctionne correctement ? S’il est détérioré, la température sera fausse : la donnée sera de mauvaise qualité.
    • Le thermomètre est-il assez précis ? Pour nous habiller, une précision à plus ou moins 1°C et un maximum à 50°C est largement acceptable. Mais dans le cas de l’industrie, où certains processus peuvent atteindre plus de 1000°C et/ou nécessiter une précision de 0,01°C, notre thermomètre "maison" ne sera pas assez résistant et précis : la donnée sera inexploitable.
    • Dans le cas de l’enquête, des indices de mauvaise qualité, comme des empreintes partielles ou des témoignages contradictoires, ne permettront pas de résoudre l’affaire.

La conservation de la donnée

    • En industrie, la température de fabrication doit être historisée afin d'identifier un problème de qualité.
    • Les indices récoltés pendant une enquête doivent être conservés et préservés jusqu’à ce que l’affaire soit résolue et qu’une culpabilité soit établie par un tribunal.

L’accessibilité de la donnée

    • En industrie, si l'opérateur n'a pas accès à la bonne température de fabrication, la qualité du produit sera mauvaise.
    • Si tous les enquêteurs n’ont pas accès aux indices, cela peut compromettre l’affaire

L’exploitation de la donnée

Prenons l’hypothèse que la donnée soit exploitable. Mais est-ce que le raisonnement basé sur cette donnée est correcte ?

    • Dans le cas du thermomètre, si le raisonnement n'est pas bon : s'habiller très légèrement quand il fait très froid peut entraîner de graves problèmes de santé.
    • Dans l'exemple de l’enquête policière, la mauvaise exploitation des indices peut faire condamner un innocent et/ou disculper un criminel.

La sécurité de la donnée

    • En industrie, si la température est un secret de fabrication, il faut la protéger des concurrents.
    • Durant l'enquête, si le coupable peut accéder aux indices pour les modifier ou les détruire, la résolution de l’affaire sera très probablement compromise.

La donnée en entreprise

La donnée en entreprise n’est pas forcément numérique. On l’associe le plus souvent à l’informatique car c’est, aujourd’hui, le meilleur moyen de la consulterl’exploiter et la conserver. Mais les données peuvent prendre toutes sortes de formes et il est important de savoir les identifier pour être sûr que les plus impactantes sont traitées correctement. Car si certaines d'entre elles ne sont pas très importantes, d'autres s'avèrent vitales.

Les données numériques

Elles représentent toutes les saisies dans des solutions logicielles et les échanges informatisés avec les partenaires.

Ce sont les données les plus exploitables mais il est primordial de s'assurer de la propriété réelle et de l'exploitabilité de ces dernières. Je m'explique: certains éditeurs de solutions informatiques rendent impossible la récupération gratuite des données saisies, comme si ces dernières n'appartenaient pas à leurs clients, les gardant ainsi captifs : je développe plus le sujet dans un autre article (cf. Réussir sa transformation numérique).

Heureusement, de plus en plus d’éditeurs changent de philosophie et offrent des mécanismes simplifiés afin de rendre à leurs clients la possibilité de s’approprier leurs propres données.

Les données matérielles

Ce sont essentiellement les données au format papier qui se situent dans des classeurs rangés dans des armoires. Des documents, parfois uniques, comme des factures clients, des factures fournisseurs, des feuilles d’émergement, etc.

La donnée papier est souvent pratique pour qui ne s’y connaît pas ou peu en informatique mais, à l’échelle de l’entreprise, ce sont les plus frustrantes : elles sont consultables et conservées mais restent très peu exploitables :

  • Pour les consulter, il faut être présent sur place.
  • La recherche d’une donnée précise est fastidieuse et le devient de plus en plus avec la quantité de documents qui augmente dans le temps.
  • Combiner des données de plusieurs documents (exploitation) est coûteuse car elle demande beaucoup de temps.
  • La conservation des données papier est hasardeuse en cas de sinistres (incendie ou inondation par exemple), et complexifie une reprise d’activité.

Les données impactantes immatérielles

Ce sont les données qui ont le plus d’impact sur l’entreprise et dont la valeur n’est pas ou peu prise en compte.

Au cours de la vie d’une entreprise, des salariés vont élaborer des techniquesdes méthodes de travail et des savoir-faire qu’eux seuls maîtrisent et qui contribuent au succès de la structure. Ces données se trouvent dans la tête de ces salariés qui, automatiquement, deviennent indispensables au fil du temps.

Ces données d’expérience, dépendantes d’un seul salarié, sont extrêmement importantes et représentent un risque pour l’entreprise : elle met en corrélation son bon fonctionnement et son succès avec une seule personne. Si cette dernière quitte la structure inopinément, l'entreprise subira une perte de productivité dans le meilleur des cas, et peut même signer sa fin dans le cas de la perte d’une recette par exemple.

Les données non impactantes immatérielles

Cet ensemble correspond à toutes les données qui ne sont pas nécessaires à la structure mais qui permettraient d’en optimiser le fonctionnement : gain de productivitégain de rentabilitéprécision de l’analyse de l’activité, etc. Le plus souvent, elles doivent être croisées avec d'autres données et/ou traitées avec des algorithmes d'intelligence artificielle afin d'en tirer pleinement la valeur.

Pour illustrer ces propos, prenons un exemple:

Une entreprise qui gère des distributeurs de boissons peut poser des capteurs de fonctionnement sur certains composants-clé de ses appareils : température, nombre de tours par minute, durée d'un traitement, etc. Ces données ne sont a priori pas utiles mais grâce à l'intelligence artificielle, elles permettent de détecter des pannes à venir sur les prochaines semaines : au lieu de 3 distributeurs qui tombent en panne en même temps, des clients mécontents et un réparateur travaillant à la hâte, on obtient un réparateur qui peut planifier ces 3 interventions à l'avance, sereinement et des clients satisfaits qui ne se sont rendus compte de rien.

Pourquoi la donnée en entreprise est-elle si importante ?

Les entreprises et les industries sont des structures dynamiques qui évoluent dans un environnement en constante évolution. La modernisation de ces structures devient un enjeu crucial afin de s'adapter aux changements.

Accéder à des informations régulièrement actualisées sur le déroulement de ses activités à tous les niveaux: achat, fabrication, déroulement, vente, facturation, encaissement, etc permet de prendre du recul sur son business, de l'optimiser, de mettre en place des stratégies et, le plus important, d'en mesurer l'efficacité : ce que j'appelle piloter sa performance.

Le pilotage de sa performance s'appuie sur les données de l'entreprise,  et c'est pour cela que ces dernières sont si importantes. Il est nécessaire de les identifier, de les lister, de les organiser en fonction de leur importance afin d'aborder une transformation numérique sereinement.

Les données conservées numériquement deviennent ainsi facilement consultables et exploitables pour gérer ses activités et potentiellement prendre de l'avance avec de l'intelligence artificielle, mais cela sera l'objet d'un autre article 😉.