Extraction des itemsets fréquents à partir de données évidentielles : application à une base de données éducationnelles
Abstract
Dans cet article, nous étudions le problème de l'extraction des itemsets
fréquents (EIF) à partir de données imparfaites, et plus particulièrement ce
qu'on appelle désormais les données évidentielles. Une base de données évidentielle
stocke en effet des données dont l'imperfection est modélisée via la théorie
de l'évidence. Nous introduisons une nouvelle approche d'EIF qui se base sur
une structure de données de type arbre. Cette structure est adaptée à la nature
complexe des données. La technique que nous avons conçue, génère jusqu'à
50% de la totalité des itemsets fréquents lors du premier parcours de l'arbre.
Elle a été appliquée sur des bases de données synthétiques ainsi que sur une
base de données éducationnelles. Les expérimentations menées sur la nouvelle
méthode, montrent qu'elle est plus performante en terme de temps d'exécution
en comparaison avec les méthodes existantes d'EIF.