Systèmes de métadonnées dans les lacs de données : modélisation et fonctionnalités
Résumé
Au cours de la dernière décennie, le concept de lac de données a
émergé comme une alternative aux entrepôts de données pour le stockage et
l'analyse des mégadonnées. Le lac de données propose un stockage des données
sans schéma prédéfini. En l'absence de schéma, l'interrogation et l'analyse des
données dépendent alors d'un système de métadonnées qui se doit d'être efficace
et complet. Cependant, la gestion des métadonnées dans les lacs de données demeure une problématique d'actualité et les critères d'évaluation de son efficacité
sont peu ou prou inexistants.
Dans cet article, nous proposons MEDAL, un modèle générique pour la gestion des métadonnées d'un lac de données. MEDAL adopte une modélisation du
système de métadonnées à base de graphes. Nous proposons aussi des critères
d'évaluation du système de métadonnées d'un lac de données à travers une liste
de fonctionnalités attendues et montrons que notre approche est plus complète
que les systèmes de métadonnées existants.