Modélisation des métadonnées d'un data lake en data vault
Résumé
Avec l'avènement des mégadonnées, l'informatique décisionnelle a
dû trouver des solutions pour gérer des données de très grands volume et variété.
Les lacs de données (data lakes) répondent à ces besoins du point du vue
du stockage, mais nécessitent la gestion de métadonnées adéquates pour garantir
un accès efficace aux données. Sur la base d'un modèle multidimensionnel
de métadonnées conçu pour un lac de données présentant un défaut d'évolutivité
de schéma, nous proposons l'utilisation d'un data vault pour traiter ce
problème. Pour montrer la faisabilité de cette approche, nous instancions notre
modèle conceptuel de métadonnées en modèles logiques et physiques relationnel
et orienté document. Nous comparons également les modèles physiques en
termes de stockage et de temps de réponse aux requêtes sur les métadonnées.