Découverte d'itemsets fréquents fermés sur architectures multicoeurs
Résumé
Dans ce papier nous proposons PLCM, un algorithme parallèle de
découverte d'itemsets fréquents fermés basé sur l'algorithme LCM, reconnu
comme l'algorithme séquentiel le plus efficace pour cette tâche. Nous présentons
aussi une interface de parallélisme à la fois simple et puissante basée sur la
notion de Tuple Space, qui permet d'avoir une bonne répartition dynamique du
travail.
Grâce à une étude expérimentale détaillée, nous montrons que PLCM est le seul
algorithme qui soit suffisamment générique pour calculer efficacement des itemsets
fréquents fermés à la fois sur des bases creuses et sur des bases denses,
améliorant ainsi l'état de l'art.