Concevoir des produits de données élégants



Listen to this blog
Disclaimer

Qu'est-ce qu'un produit de données ?

La façon dont les entreprises perçoivent les données et dont elles accèdent à des informations fiables évolue rapidement. La demande d’informations augmente de manière exponentielle et des stratégies visant à gérer les données plus efficacement émergent. Au cœur de ce changement se trouve un changement progressif de mentalité. Les entreprises commencent à considérer les données comme un produit, une offre packagée réutilisable et affinée. Cette approche s’éloigne de la mentalité basée sur les projets, où chaque demande de données est satisfaite par un nouveau pipeline de données unique.

Les principaux avantages des produits de données sont les suivants :

Réutilisabilité
Réutilisabilité
Accès facile
Accès facile
Partageabilité
Partageabilité

Comme pour tout produit, la manière dont les produits de données sont conçus et présentés aux utilisateurs fait une différence significative. Voyons maintenant comment concevoir des produits de données élégants.

Lorsque nous parlons de produits de données, nous les utilisons dans le contexte d'une stratégie informatique plus vaste ou d'un maillage de données. Il ne faut pas confondre cela avec un produit de données faisant partie d'une stratégie commerciale de base, où un produit de données ciblant les clients est le principal générateur de revenus d'une organisation. Nous ne parlons pas de produits de données tels que Google Analytics ou Bloomberg.

Gartner définit un produit de données comme :
« Une combinaison organisée et autonome de données, de métadonnées, de sémantique et de modèles. Elle comprend une logique d'accès et de mise en œuvre certifiée pour faire face à des scénarios commerciaux spécifiques et à la réutilisation. Un produit de données doit être prêt à être consommé (confié par les consommateurs), maintenu à jour (par les équipes d'ingénierie) et approuvé pour l'utilisation (gouverné). Les produits de données permettent divers cas d'utilisation de données et d'analyse (D&A), tels que le partage de données, la monétisation des données, l'analyse de domaine et l'intégration d'applications. »

Cette définition très détaillée et complexe peut être exacte ; cependant, une définition plus élégante pourrait venir de J. Majchrzak qui définit un produit de données comme « une unité de données autonome, optimisée en lecture et standardisée contenant au moins un ensemble de données (ensemble de données du domaine), créé pour satisfaire les besoins des utilisateurs ».

Bien que les deux définitions soient exactes, l'une d'entre elles est plus simple et plus facile à utiliser. De même, les produits de données élégants sont plus faciles à utiliser et donc précieux.

Qu'est-ce qu'un design élégant ?

Comment savoir si un design est élégant ? Albert Einstein a dit : « Tout doit être aussi simple que possible, mais pas plus simple. » Un produit de données élégant doit donc être aussi simple que possible pour obtenir le meilleur résultat.

Regardons d’autres incontournables d’une solution élégante :

  • Concentré et suffisamment efficace pour atteindre un résultat défini avec des ressources limitées
  • Assez cohérent pour gérer les cas extrêmes dans la logique de base, pas de réflexion ni de capacités ajoutées
  • Assez puissant pour être appliqué à plusieurs applications

Pourquoi un design élégant est-il important ? Moins de complexité rend les choses plus faciles et plus agréables à consommer, ce qui génère une plus grande valeur. Une solution simple mais efficace surpassera la complexité.

Mentalité du produit de données

La première étape pour concevoir et créer des produits de données élégants consiste à adopter une approche axée sur les produits de données. Il s'agit souvent du plus grand obstacle.

Pour adopter une mentalité de produit de données, vous devez vous débarrasser de la mentalité de projet. Il s'agit de l'idée selon laquelle chaque fois qu'une demande de données est reçue par le groupe d'ingénierie des données, un nouveau projet est créé et exécuté. Cette mentalité de projet est beaucoup plus réactive, les ingénieurs de données s'efforçant constamment de créer des pipelines de données en fonction des exigences des parties prenantes. Une fois qu'un projet est terminé, il est temps de l'oublier et de passer au suivant.

L'état d'esprit du produit a évolué. Les ingénieurs, analystes et gestionnaires de données réfléchissent de manière plus proactive aux données. Au lieu d'attendre des demandes de données ad hoc, les analystes, ingénieurs et gestionnaires travaillent ensemble pour créer des produits de données avant qu'ils ne soient nécessaires. Cette approche nécessite des recherches et des analyses approfondies pour créer des produits de données qui seront les plus utiles à un plus grand nombre d'utilisateurs, générant ainsi une plus grande valeur par résultat.

Les produits de données sont également réutilisables, ce qui leur permet de rester pertinents tout au long de leur cycle de vie, qui comprend une maintenance et une amélioration continues. Au fur et à mesure que les produits de données prennent vie, les retours d'expérience peuvent être facilement intégrés aux nouvelles versions.

Le plus grand défi dans la mise en œuvre et la création de produits de données efficaces et élégants est de créer le bon état d'esprit. Lorsque vous passez d'une stratégie de produit de données à une stratégie de projet de données, le succès se mesure aux résultats et non aux extrants. Bien que les produits de données évoluent, une planification et une conception efficaces en amont aideront à établir les bases de produits de données élégants.

Caractéristiques clés des bons produits de données

Les produits de données efficaces et performants présentent généralement certaines caractéristiques. Les concepteurs doivent garder ces caractéristiques à l'esprit lors de la création des produits de données :

Découvrable

Pour que les produits de données aient un impact, ils doivent être facilement détectables. Même un produit fantastique ne réalisera pas son potentiel si personne ne sait qu'il existe. Les marchés de produits de données sont d'excellents moyens de mettre les produits de données entre les mains des utilisateurs. Certains marchés de produits de données utilisent l'IA et l'analyse prédictive pour suggérer des produits de données aux utilisateurs, de la même manière que Netflix suggère de nouveaux films ou émissions aux téléspectateurs. L'élégance ne réside pas toujours dans la façon dont vous concevez le produit, mais aussi dans la façon dont vous le commercialisez et le rendez accessible aux utilisateurs.

Qualité

Des données propres et précises sont indispensables pour tout produit de données. Si les analystes de données ne peuvent pas vous faire confiance, votre produit de données ne sera pas apprécié par les décideurs. La conception et la création de produits de données doivent inclure un processus fiable de nettoyage et de normalisation des données lors de leur fusion et de leur intégration.

Une fois le processus défini, vous devez vous assurer qu'il fonctionne et le prouver à votre public. Cela implique de suivre et de partager des indicateurs de qualité des données pour mesurer la variabilité et l'exhaustivité, entre autres qualités.

Sécurisé

La sécurité des données est une exigence de toute stratégie informatique, mais l'intégration de la sécurité dans votre produit de données peut être nuancée. Des produits de données élégamment conçus peuvent fournir un accès granulaire aux ressources de données. La conception de règles d'accès qui prennent en compte les rôles des utilisateurs et les attributs des données équilibre l'accès et la sécurité. Ces contrôles d'accès et le masquage des données permettent également une utilisation efficace des tables de données.

Une autre caractéristique importante est l’inclusion d’un cryptage sophistiqué garantissant la protection des données lorsqu’elles sont transférées de la base de données vers l’analyse.

Observable

Pour garantir une qualité continue, les produits de données de qualité doivent disposer de capacités d'observabilité intégrées. La qualité des produits de données dépend de la qualité des données qu'ils fournissent. Si les décideurs ne font pas confiance aux données produites par les produits de données, ils perdent leur valeur. Les produits de données doivent être conçus avec des fonctions de surveillance intégrées qui détectent les anomalies et les erreurs. Cela réduit la probabilité que des données erronées se retrouvent dans l'analyse d'un dirigeant ou soient utilisées pour former des modèles d'IA.

Évolutif

L’un des autres avantages de l’adoption d’une approche basée sur les produits est que plus un produit de données est utilisé, plus il apporte de valeur à l’organisation. Les produits de données sont très flexibles et peuvent être appliqués à plusieurs cas d’utilisation, ce qui augmente leur utilité. Par conséquent, les produits de données doivent être conçus pour évoluer et répondre à la demande croissante des utilisateurs.

Collaboratif

Il est essentiel d’obtenir des informations provenant de diverses sources pour que les produits de données soient suffisamment puissants pour résoudre plusieurs problèmes.

Il est essentiel de constituer une équipe diversifiée pour créer des produits de données et les cadres de support. De nombreuses parties prenantes jouent un rôle dans la création de produits de données performants, notamment les producteurs de produits de données, les propriétaires de domaines et les consommateurs.

Les producteurs de produits de données sont ceux qui s'investissent le plus dans le succès d'un produit de données et prennent donc les devants. Ils peuvent avoir des compétences en ingénierie des données ou en analyse de données, mais l'objectif principal est de comprendre les besoins des consommateurs. Ceux qui ont une formation en gestion de produits ou en propriété de produits comprennent l'état d'esprit du produit.

Les propriétaires de domaine jouent également un rôle essentiel et sont généralement responsables de la bonne gouvernance. La gouvernance permet de définir les contrôles et les politiques appropriés qui conduisent au succès ou à l'échec d'un produit de données, ce qui rend le rôle du propriétaire de domaine important.

Les consommateurs de produits de données sont également un élément clé du cycle de vie continu des produits de données. Leur engagement et leurs commentaires permettent d'améliorer l'utilité des produits de données. Ils peuvent évaluer leur satisfaction à l'égard des produits de données individuels et dans quelle mesure ils répondent à leurs besoins. Le suivi du comportement des consommateurs de produits de données est également un élément important de l'intégration des consommateurs dans le processus.

Accessible

Tout comme la découvrabilité, l'accessibilité efficace est une caractéristique importante des produits de données de qualité. Une accessibilité facile améliore le processus d'obtention des produits de données et leur utilisation à des fins d'analyse aussi simplement que possible, ce qui permet d'obtenir des informations plus rapidement. L'un des obstacles à un accès rapide est l'importation de produits de données dans votre outil de BI ou votre outil de création de modèles d'IA. Des conceptions de produits de données élégantes permettent d'accéder aux produits de données à partir de n'importe quel package d'analyse préféré.

Le deuxième obstacle, peut-être le plus difficile à surmonter, est l'obtention de l'autorisation d'accès aux données. La mise en place de protocoles appropriés pour permettre l'accès rend le processus plus sûr et plus efficace. Définir clairement qui est responsable de l'autorisation d'accès est un élément important de la définition de protocoles élégants. Dans un cadre plus distribué, les gestionnaires de domaine qui supervisent la collecte de données dans leur groupe ont l'autorité pour accorder l'accès.

Les abonnements et les contrats de données définissent la durée d'accès et la manière dont les données peuvent ou non être utilisées. En standardisant ces accords en amont, les utilisateurs n'ont pas à suivre le processus à chaque fois qu'ils souhaitent accéder à un produit de données, ce qui simplifie le processus.

Personnalisable et interopérable

Pour répondre aux besoins des utilisateurs, les produits de données doivent être adaptables aux exigences commerciales spécifiques et aux préférences des utilisateurs.

Au lieu d'ajouter des fonctionnalités de données peu pratiques, des produits de données élégants doivent également être conçus pour interagir avec d'autres produits de données. Grâce à l'interopérabilité intégrée à la conception, les produits de données peuvent être facilement combinés pour créer des super produits de données plus riches et plus précieux.

Auditable

À mesure que les produits de données évoluent, certains changements seront des améliorations, mais pas tous. La modification des produits de données peut également exposer des vulnérabilités, telles que des risques de sécurité et de conformité. Pour garantir que les produits de données sont de la plus haute qualité, ils doivent inclure des essais d'audit et des données de versionnage. L'identification rapide des erreurs et l'identification de la source contribueront à assurer le bon fonctionnement de votre produit de données de manière sûre et efficace.

Axé sur les cas d'utilisation

Pour être complets et cohérents, les produits de données doivent être capables de résoudre efficacement les problèmes des utilisateurs à chaque fois. Pour y parvenir, ils doivent être conçus comme n'importe quel autre produit, en plaçant l'utilisateur final au centre du processus. Que l'utilisateur soit un ingénieur de données, un analyste de données, un analyste commercial, un dirigeant d'entreprise, un client ou un partenaire, une compréhension complète de ses besoins est la clé du succès.

Les produits de données complets intègrent un large éventail de sources de données pour garantir l'exhaustivité et la couverture cohérente des cas d'utilisation. L'enrichissement des données avec des sources partenaires ou tierces peut ajouter une profondeur supplémentaire au produit de données. Par exemple, l'utilisation de bases de données de codes postaux pour compléter les données d'adresse manquantes et leur standardisation peuvent rendre les produits de données plus complets et cohérents.

Les utilisateurs doivent être en mesure de comprendre clairement ce que représentent les données de votre produit de données pour que cela soit applicable à leur cas d'utilisation. Cela peut être un défi car les données proviennent de toute l'organisation. Une gestion appropriée des métadonnées est importante pour créer des produits de données puissants et garantir la préservation du contexte. Il est également important de s'assurer que les utilisateurs comprennent la terminologie utilisée pour décrire les données dans le produit de données. L'intégration de glossaires d'entreprise est un moyen de contribuer à normaliser la terminologie.

Gestion du cycle de vie

L’un des principaux facteurs de différenciation entre les produits de données et les projets de données est la performance des produits de données et leur capacité à être constamment améliorés. Même si nous faisons de notre mieux pour concevoir un produit de données qui réponde aux besoins de notre public, il ne sera pas toujours à la hauteur ou nécessitera simplement des modifications. Il est essentiel de mettre en place un mécanisme permettant de recueillir les commentaires des utilisateurs pour proposer en permanence des produits de données de qualité.

Le suivi des produits de données et la compréhension de leur résonance auprès des utilisateurs sont essentiels pour connecter les produits aux utilisateurs. Un marché de produits de données jonché de produits de données obsolètes et non pertinents ne se prête pas à un processus élégant. Les produits de données doivent être archivés et retirés lorsqu'ils atteignent la fin de leur cycle de vie, ce qui réduit le bruit. Assurez-vous de gérer votre marché de produits de données pour optimiser l'expérience utilisateur.

Processus

Les produits de données élégants ne se créent pas tout seuls, ils nécessitent un processus approprié pour soutenir leur création. Sans cela, il y a une tendance à ajouter plus de données, ce qui ajoute de la complexité. Un processus garantit que les données sont ajoutées délibérément. Les conceptions élégantes sont produites par des processus itératifs et collaboratifs.

Les processus de conception itératifs favorisent une conception élégante, car chaque étape ou cycle vous rapproche d'une solution plus simple et plus puissante. Les premières versions des produits de données peuvent ne pas constituer la solution optimale, elles doivent donc évoluer. Les fonctionnalités inutilisées ou qui perturbent le chemin vers le meilleur résultat peuvent être éliminées par itération. Les nouveaux utilisateurs peuvent trouver des applications innovantes pour les produits de données qui génèrent de nouvelles fonctionnalités ou une séparation du produit de données d'origine en quelque chose de nouveau et plus impactant. Votre processus doit intégrer et institutionnaliser les commentaires pour mieux comprendre comment votre produit de données atteint son objectif. À mesure que les produits de données évoluent et que les commentaires sont recueillis, des idées émergent pour de nouveaux produits de données.

Créer des produits de données de qualité n'est pas une mince affaire. Le créer de toutes pièces sans une base technologique solide peut être encore plus difficile. Les plateformes de produits de données peuvent grandement faciliter le processus. Avrio est une plateforme d'analyse de données moderne conçue de A à Z pour rationaliser la création de produits de données. Pour en savoir plus sur les fonctionnalités d'Avrio et sur la manière dont la plateforme peut vous aider à créer des produits de données élégants, planifiez une démonstration .

Discover the Latest in Data and AI Innovation

  • Stratégies d'intégration et de synchronisation des données dans les produits de données

    Read More

  • Comment instaurer la confiance grâce aux produits de données

    Read More

  • Cycle de vie de la santé des données : stratégies de nettoyage et de transformation des données

    Read More

Request a Demo TODAY!

Take the leap from data to AI