RNTI

MODULAD
Gestion de la qualité des données ouvertes liées - États des lieux et perspectives
In OD 2016, vol. RNTI-E-32, pp.53-78
Résumé
Sous l'impulsion de l'apparition de nouvelles technologies permettant la publication et l'exploitation de données ainsi que de contraintes réglementaires imposant à certaines entreprises et institutions d'ouvrir leur données, la publication de données liées est devenue un phénomène en pleine croissance. Cette immense ressource de données offre de grandes possibilités d'exploitation. Cependant, on constate un niveau très disparate de qualité des données publiées, rendant leur utilisation difficile, voir risquée. L'évaluation et la maîtrise de la qualité de ces données deviennent de ce fait un enjeu de premier plan. Dans cet article, nous dressons un état de l'art des approches méthodologiques et techniques de gestion de la qualité des données ouvertes liées proposées dans la littérature. Le périmètre couvert inclut les dimensions et métriques, les frameworks de gestion, les plateformes et outils associés, et enfin les cas d'étude de publication et d'utilisation des données ouvertes liées centrés sur la qualité de celles-ci. En nous fondant sur cet état de l'art, nous exhibons des problèmes ouverts et des perspectives de recherche du domaine.