Extraction des itemsets fréquents à partir de données évidentielles : application à une base de données éducationnelles

Boutheina Ben Yaghlane, Mohamed Anis Bach Tobji

In FDC 2011, vol. RNTI-E-21, pp.211-232

Résumé

Dans cet article, nous étudions le problème de l'extraction des itemsets fréquents (EIF) à partir de données imparfaites, et plus particulièrement ce qu'on appelle désormais les données évidentielles. Une base de données évidentielle stocke en effet des données dont l'imperfection est modélisée via la théorie de l'évidence. Nous introduisons une nouvelle approche d'EIF qui se base sur une structure de données de type arbre. Cette structure est adaptée à la nature complexe des données. La technique que nous avons conçue, génère jusqu'à 50% de la totalité des itemsets fréquents lors du premier parcours de l'arbre. Elle a été appliquée sur des bases de données synthétiques ainsi que sur une base de données éducationnelles. Les expérimentations menées sur la nouvelle méthode, montrent qu'elle est plus performante en terme de temps d'exécution en comparaison avec les méthodes existantes d'EIF.

Aperçu Voir bibtex

Télécharger