French

Les métadonnées sont les données qui décrivent d'autres données (sémantiquement les données à propos des données). Il s'agit de l'information qui permet de retrouver les données stockées. Par exemple les métadonnées les plus courantes sont la date de sauvegarde, la taille et l'auteur du fichier... toute information permettant d'identifier et localiser les données voulues à un moment donné (que ce soit un document, un fichier audio, une image, en principe tout type d'information stockée).

Une stratégie de gestion des métadonnées est dès lors nécessaire pour garantir la bonne santé des données d'une part (voir qualité*, gouvernance*) et pour en permettre une exploitation intelligente au sein de l'organisme (par les utilisateurs attitrés). Les données doivent pouvoir être exploitées à tout moment dans le temps, quels que soient les changements subis par l'organisme (nouveaux employés, nouvelles utilisations des ressources...). Ceci nécessite que les métadonnées soient dès le départ utilisables par d'autres, c'est-à-dire pensées dans une logique qui en permet l'identification par d'autres que leur seul créateur.

Les métadonnées doivent permettre l'analyse des données mais aussi garantir l'agilité de l'organisme. Une bonne gestion des (méta)données ne peut être dissociée de la gouvernance* tout comme elle ne peut ignorer les fameux trois V (volume, vélocité et variété) du big data* (une 4ème notion récente y ajoutant la valeur). La montée en flèche du phénomène big data* a mis en évidence plus que jamais la nécessité stratégique pour les sociétés de tirer profit de leurs données à des fins de marketing et de croissance.

Les métadonnées sont historiquement à la base de l'archivage qui est le coeur de métier d'organismes tels que:

  • les bibliothèques
  • l'industrie de la musique
  • le monde de l'édition (imprimée et numérique)
  • les administrations...

A l'ère d'Internet, toute entité impliquée dans la rétention de données personnelles est par définition concernée par les métadonnées (voir big data*), on peut y retrouver les plus gourmands en la matière que sont, entre autres :

  • les réseaux sociaux (Facebook et Youtube en tête)
  • les poids lourds de l'eCommerce (AmazoneBay...)
  • Netflix
  • Apple
  • Google (voir SEO et metatags)...

En quoi les métadonnées sont-elles si essentielles en 2015?

L'analyse du Big Data* implique l'utilisation d'outils adaptés, et comme dit précédemment, la métadonnée sous toutes ses formes est un élément-clé de cette analyse. La donnée n'a de valeur que dans un contexte bien précis et une bonne méthode de gestion des métadonnées facilite l'intégration, le partage et la collecte de ces données vitales, ce qui permet ensuite de les interpréter et de les utiliser dans une stratégie axée business, entre autres.

En résumé, pas de données sans métadonnées. Pas d'évolution sans bonne gestion de base de données.

Lexique :

qualité des données : les écrans, les listes fournissent à l’utilisateur l’information dont il a besoin pour agir et décider. Cette information est le résultat d’une agrégation de données selon des règles prédéfinies. Fournir à l’utilisateur une information de « bonne » qualité exige à la fois des données de bonne qualité et des agrégations de données cohérentes et crédibles.

gouvernance des données : la gouvernance des données se doit de définir les règles dans lesquelles s’exercent les activités de gestion des données, de veiller au respect de ces règles et à leur mise en application et d’en assurer les évolutions et les évaluations.

big data : l'or noir du 21ème siècle, il offre aux entreprises la possibilité de mieux cibler sa clientèle et de la différencier en lui proposant des offres personnalisées de services. Il consiste en toutes les informations récoltées off- et online permettant l'analyse et la prédiction des comportements, données essentiellement utilisées en marketing. Problématique soulevée par le big data : la protection des données dites sensibles ou confidentielles souhaitée à juste titre par les individus. Une solution passe notamment par l'anonymisation des données au sein des entreprises.

Mots clés: 

Auteur: 

Muriel Adamski