Construction d'un graphe de dépendances fonctionnelles à partir de tableaux web
Résumé
La découverte de dépendances est au coeur de nombreux efforts de
profilage et de nettoyage des données. Parmi les dépendances les plus importantes
pour les bases de données relationnelles, on trouve les dépendances fonctionnelles
(DFs) qui représentent des contraintes entre les attributs d'un modèle
de données relationnelles. Dans cet article, nous proposons une méthodologie
permettant de construire à partir d'un corpus de tableaux web, une base
de connaissance qui prend la forme d'un graphe dont les noeuds sont des types
sémantiques et dont les arêtes représentent l'existence d'une dépendance fonctionnelle
relaxée.