un DATA STEWARD
UN DATA STEWARD ?
Le responsable de toutes les données de l’entreprise
Le Data Steward est le responsable « référent » des données dans l’entreprise. Il est le « monsieur-Datas » de la société, véritable organe de gestion et de liaison :
- Il est le gardien et le garant de la bibliothèque de toutes les données qui entrent, sortent, transitent ou vivent dans la société
- Il en centralise la gestion pour en contrôler la qualité, l’unicité et la pertinence dans des schémas de mise à jour et de création
- Il est l’interlocuteur privilégié des équipes métier pour définir les process d’exploitation et de diffusion.
Le rôle du Data Steward est donc de mettre en place un contrôle efficace au jour le jour de la cartographie des données et de leur gestion.
quel role pour le data steward ?
Dans certaines structures importantes, ses taches d’acquisition, de conservation et de recensement peuvent être transférées à des Data Owners. Cette vision nous parait contreproductive dans la mesure où ces informations caractérisent aussi la data.
Notre data Steward aura donc notamment en charge :
- Le développement d’une cartographie efficace des données pour tous les acteurs de son parcours
- La gestion au quotidien des métadonnées associées (propriétés des données)
- Le contrôle de la qualité et la pertinence des données au travers de règles de gestion précises et circonstanciées, intégrant son process d’apparition ou de création
- L’établissement des responsabilités de ces acteurs dans le parcours de transformation de ces données
- La mise à disposition auprès des équipes d’une compétence d’appui pour l’utilisation des données
pourquoi un data steward ?
Chaque structure de production ou de services fournit et utilise des données de toutes sortes. Elles permettent de tracer et de mesurer cette production et toutes les activités en découlant de la comptabilité à la qualité en passant par la gestion du personnel …
Avec les nouveaux outils de collationnement et d’analyse, l’exploitation de ces données devient un enjeu primordial pour la gouvernance en termes de gestion et de stratégie. Du simple tableau Excel à un tableau de bord Bi ou une extraction d’un ERP, toutes les entreprises aujourd’hui capitalisent sur ce trésor de datas.
Mais ces données sont de toutes natures et de toutes provenances. Elles s’entremêlent aussi entre elles. Quelques exemples :
- Les données complémentaires : N’y a-t-il au moins deux annuaires du personnel, l’officiel et celui construit par tel service pour ses propres besoins avec des données non stockées dans la version de base ?
- Les données relatives entre elles : Un âge n’est-il pas dépendant d’une date de lecture ?
- Les données à la pertinence aléatoire : Les temps de production d’un outil ne sont-ils pas dépendants des fréquences de mise à jour ?
- Des données interdépendantes : Le tarif des produits en grand nombre ne dépend-t’il pas des volumes d’achats du client ?
- Les données non sécurisées : ces copier/coller sauvages n’apportent-ils pas des risques dans les données consolidées ?
Il est évident que la centralisation et la gestion de la qualité des données utilisées peuvent être des atouts indéniables pour le suivi des résultats et la gouvernance d’une entreprise. Mais si chaque acteur est seul décisionnaire des données qu’il apporte au modèle global sans surveillance sans centralisation et sans contrôle il existe un risque de « capharnaüm de datas », l’atout devient un risque.
La présence même de l’existence de ce « maître de la data » – sous réserve qu’elle soit largement diffusée – crée la dynamique collective d’une centralisation des données. La satisfaction des besoins métiers sont alors beaucoup simples et efficients.
Il existe aussi un aspect psychologique à cette construction autour d’un îlot de données. Chaque acteur d’une donnée va pouvoir constater son importance dans la construction de la chaîne de valeur et ainsi prendre conscience de l’importance de ses taches de collation, de contrôle …
LA GESTION DES DONNEES / META-DONNEES
Le dictionnaire définit ainsi une donnée : « … Représentation conventionnelle d’une information en vue de son traitement informatique … »
Le concept de base a beaucoup évolué avec l’avancée des capacités de stockage, de structuration et de programmation. Aujourd’hui, tout est devenu « data » pour ne pas dire donnée : des informations textuelles et/ou chiffrées, des images ou des vidéos, des liens, même des documents, des supports … Ces datas se manipulent et circulent sur des réseaux soit internes soit externes.
Leur existence peut parfois poser problème quand elles sont d’ordre privé ou confidentiel. La création d’organismes d’état pour en surveiller les dérives est à ce sens révélateur (RGPD, CNIL …).
La prolifération des ces informations ne va pas sans risque. L’existence de fausses datas, parfois générées sans mauvaises intentions mais par manque de contrôle, et quelques fois clairement construites dans un but de nuisance obligent à une sécurité de plus en plus efficace. Fake news, piratage, espionnage …
La circulation des datas suppose aussi un partage, un accès à tous ceux qui doivent les utiliser, les modifier, les surveiller, les concaténer voire les détruire. Un enjeu sécuritaire se lie systématiquement à la gestion de toutes ces données.
Enfin, le stockage de cette masse importante d’informations constitue un enjeu stratégique. Pour les plus grandes entreprises, les solutions externalisées sont indispensables. La bataille que se livrent les grands acteurs tels les Microsoft, Amazon, Google, Oracle, IBM … en est le témoin. Pour les plus petites, celles dont le volume de données n’est pas de nature à ébranler un serveur interne, des solutions partagées ont également fleuri (Sharepoint …). Même pour les TPE/TPI une organisation bien calibrée avec des ressources matérielles et logicielles internes peut souvent s’avérer suffisante.
Si le stockage et le collationnement ne sont pas en soit des points bloquants pour mettre en place une politique de gestion des données, et si leur importance s’impose dans la conduite et la planification des entreprises, leur gestion de façon ordonnée, contrôlée et partagée reste donc essentielle. Le rôle du Data Steward est donc essentiel. Son travail permettra de batir et de faire vivre cette masse d’informations partagée.
Méta-Données
Création
- Provenance / Process de création
- Méthode création (import, écriture …)
- Support et taille (serveurs, cloud…)
- Enveloppes de données (nom fichier … )
- Format et type
- Structuration
- Véracité (contexte)
- Qualité (propreté) – Niveau de confiance
- Disponibilité
- Etat de complétude
- Sécurité – Confidentialité – Protection
- Process de vérification
- Partageabilité
- Pérennité (non dégradation)
Acteurs
- Acteurs (annuaire) création / gestion / utilisation (autorisation)
- Autorité sur la donnée
Vie de la donnée
- Automatisation
- Transformation
- Dédoublonnage
- Certification & Révision
- Données conjointes
- Durée de vie – Limites
- Délai inscription après événement
- Conditions d’utilisation
- Priorité
Me Contacter