La collecte de données est définitivement tendance de nos jours, d'autant plus que l'on parle désormais de mégadonnées, de forage de données, d'apprentissage machine, d'apprentissage profond, etc. Mais les données ne s'équivalent pas toutes. Vos données n'ont de valeur que ce que vous en faites ... et cela a un coût.
Mais que représente la valeur de ces données ? Pour mettre en œuvre une bonne stratégie de gestion des données et rentabiliser vos investissements, il est essentiel de comprendre les données de l'organisation et la manière dont elles sont utilisées pour prendre des décisions ou tirer des conclusions.
La collecte et le traitement de données de qualité augmenteront la valeur des informations que vous en tirerez.
Gardez à l'esprit les caractéristiques suivantes lorsque vous examinez vos données et leur potentiel de création de valeur :
Pertinentes
Comment les données se rapportent-elles au contexte dans lequel vous les utilisez ? Avant d'investir dans la collecte de données, il est impératif de bien comprendre comment elles vont soutenir les objectifs de votre recherche ou de votre organisation.
Si vous ne pouvez pas expliquer comment les données seront utilisées, vous devez vous requestionner les raisons de votre investissement dans leur collecte.
Précises
Les données collectées sont-elles exemptes d'erreurs et proviennent-elles d'une source fiable ? Des données de qualité qui ne contiennent pas d'erreur (fautes typograpahiques, redondances, etc.) sont sans aucun doute essentielles dans un monde relationnel.
Les données non fiables que vous injectez dans votre processus auront un impact direct sur la qualité des informations et les décisions que vous prendrez sur la base de celles-ci. Des données inexactes résultent en un retour sur investissement nul ou même négatif.
Complètes
Les données comprennent-elles suffisamment d'informations pour être utiles ? Lorsque vous investissez dans la collecte et la transformation des données, examinez attentivement l'exhaustivité des informations. Lorsque vous les traitez, pensez également à inclure toutes les données dont vous disposez pour permettre une analyse plus approfondie.
Des données incomplètes entrainent des erreurs, des hypothèses de moindre qualité et, en bout de ligne, elles peuvent être tout simplement inutilisables et coûteuses.
Consistantes
Les données peuvent-elles être interprétées de la même manière à chaque fois qu'elles sont utilisées ? La cohérence des données signifie qu'il n'existe qu'une seule version des mêmes données et que celle-ci est maintenue.
Les biais injectés dans le processus d'analyse en utilisant des données incohérentes peuvent conduire à des erreurs coûteuses.
Disponibles
Les données sont-elles disponibles au bon moment et accessibles quand on en a besoin ? À quoi bon dépenser de l'argent pour collecter des données si elles ne sont pas facilement accessibles aux utilisateurs qui doivent en tirer de la valeur ?
Le timing est essentiel et le temps c'est de l'argent. Votre investissement sera sans valeur si les données ne peuvent être utilisées lorsqu'elles sont requises.
Vérifiables
Les modifications apportées aux données peuvent-elles être retracées dans le temps ?
Investir dans la conservation de données de haute qualité implique de mettre en place les contrôles adéquats pour préserver leur intégrité et évaluer leur pertinence dans le temps.
Ne pas comprendre comment les données évoluent au sein de l'organisation peut avoir un impact sur la valeur des informations qui en sont tirées.
Pour entamer une réflexion sur le coût réel des données, examinons leur cycle de vie et les différents coûts qui y sont associés.
Collecte
Cette première étape correspond au moment où les données entrent dans votre organisation. Que vous les génériez, que vous les obteniez à partir d'autres systèmes ou applications, que vous les receviez de divers dispositifs, les données sont créées d'une manière ou d'une autre et doivent être emmagasinées quelque part.
La collecte des données demande généralement beaucoup de travail. Le nettoyage et la restructuration des données collectées demandent également beaucoup de temps. Rendre les données utilisables par les différents systèmes peut également être complexe et sujet à des erreurs.
Outre l'investissement en ressources humaines et en expertise, la phase de collecte des données comprend également des coûts liés à l'entreposage, comme l'espace disque, et à l'accès, sous la forme d'applications et de systèmes.
Traitement
Une fois que les données collectées sont préparées et sauvegardées, de nombreux processus peuvent être entrepris pour préparer les données brutes qui seront utilisées par divers processus afin de les convertir en information valable.
Bien que l'ordre des opérations puisse varier, la préparation des données comprend généralement l'intégration de données provenant de sources multiples, la validation des données et l'application de diverses transformations. Au cours de ces processus, les données sont généralement reformatées, synthétisées, regroupées, standardisées et enrichies dans le cadre des flux de traitement de données.
Les coûts associés à cette étape sont souvent liés aux investissements dans le matériel informatique, la mémoire, la capacité du processeur et bien sûr dans le talent des développeurs pour programmer les différents traitements requis.
Analyse/Rapports
Les données étant prêtes à être consommées, l'étape d'analyse/rapport est celle où se déroulent les traitements les plus critiques. Indépendamment du degré ou de la méthode d'exploration et d'interprétation des données, les investissements à ce stade sont ceux pour lesquels le retour sur investissement (ROI) le plus élevé est attendu.
Les investissements réalisés en ce sens sont principalement axés sur l'acquisition d'applications ou d'expertise pour extraire les connaissances qui généreront de la valeur pour l'organisation ou les projets de recherche. Avec le volume de données brutes qui sont aujourd'hui facilement disponibles et/ou générées, gagner en efficacité à ce stade-ci est essentiel et donc directement corrélé aux dernières avancées en matière de modélisation des données et de méthodes d'intelligence artificielle, le cerveau humain n'étant plus adapté pour donner un sens à un tel volume de données.
Sauvegarde et Archivage
Une fois les analyses effectuées et les informations extraites partagées à l'intérieur ou à l'extérieur de l'organisation, selon les besoins, les données sont généralement conservées pour être consultées ultérieurement. Aussi, tout au long de leur cycle de vie, des mesures de protection doivent être mises en place pour garantir la préservation de leur intégrité et leur accès. Cela s'avère exact non seulement pour les données brutes, mais aussi pour les informations qui en ont été extraites et qui doivent également être archivées et préservées.
Les investissements à ce stade comprennent l'espace disque, le développement d'entrepôts de données, d'outils d'intelligence d'affaires et de visualisation des données, etc.
Des données de qualité à partir desquelles des informations de valeur peuvent être extraites sont essentielles pour donner aux organisations un avantage concurrentiel et la crédibilité nécessaire pour générer de la croissance.
Tel que mentionné précédemment, le retour sur investissement de vos données se matérialisera par le résultat de l'analyse et le partage des informations qui en sont extraites.
La valeur maximale n'est extraite de vos données que lorsque vous pouvez rendre le résultat de votre analyse (ou extraction d'informations) entièrement explicable, donc fiable.
L'extraction de connaissances à partir de vos données doit être un processus contrôlé. À ce titre, vous devez comprendre et gérer efficacement chaque étape du processus pour garantir la préservation de l'intégrité des informations.
Une bonne modélisation des données peut fournir la structure dont vous avez besoin pour mieux visualiser vos données et détecter les erreurs et les oublis en début de processus, au moment où une modification s'avère la moins couteuse. En veillant à ce que des méthodes fiables et interprétables soient utilisées pour transformer et analyser vos données, vous augmenterez la fiabilité et la valeur des informations obtenues.
Des décisions opportunes prises à partir de données fiables et bien structurées faisant l'objet d'un traitement à l'aide de méthodes justifiables et fournissant des résultats pouvant être expliqués maximiseront le rendement de votre investissement.
Une fois que vous avez payé pour collecter, traiter, analyser et stocker vos données, que faire d'autre pour en extraire plus de valeur ? Plusieurs stratégies sont possibles, et souvent négligées, pour extraire de la valeur additionnelle. Explorons-en quelques-unes :
Entretenez-les L'entretien est une stratégie évidente à adopter pour extraire plus de valeur de vos données. Toutefois, elle peut sembler paradoxale, puisqu'elle nécessite davantage d'investissements. Pourtant, en conservant des données propres et pertinentes, vous ferez des économies à long terme en minimisant les erreurs coûteuses pouvant provenir de données non fiables.
Réutilisez-les Malheureusement, les données ne sont souvent utilisées qu'une seule fois, puis archivées ou écartées. Dans de nombreux cas, ces mêmes données pourraient être réutilisées par d'autres secteurs de l'organisation ou par d'autres chercheurs, si seulement ils étaient conscients de leur existence. Chaque fois que les données sont réutilisées, elles génèrent de la valeur sans nécessiter beaucoup d'investissements supplémentaires.
Enrichissez-les Les données dont vous disposez peuvent être combinées et enrichies pour augmenter leur capacité à générer une valeur supplémentaire. L'enrichissement des données peut prendre de nombreuses formes, allant de l'obtention d'un plus grand nombre d'attributs à l'injection de données supplémentaires dans votre analyse pour obtenir des informations ou des conclusions plus significatives.
Partagez-les Le partage des données au sein de votre organisation, entre pairs, au sein d'une communauté ayant un intérêt similaire, peut bonifier vos investissements. Si vous pouvez combiner ou regrouper les investissements pour cibler la collecte de données complémentaires, la synergie en vaudra la peine.
Vous vous étouffez avec des données alors que vous êtes affamé d'informations ? Prenez du recul et regardez-y de plus près ...