Echantillonnage d'itemsets à forte utilité moyenne sous contraintes de taille
Résumé
Les algorithmes d'extraction d'High-Utility Itemset (HUI) sont des
méthodes permettant de découvrir des connaissances dans une base de données
où les items sont pondérés. Leur importance a été largement démontrée dans de
nombreuses applications réelles. Dans cet article, nous proposons un algorithme
nommé HAISAMPLER qui échantillonne des itemsets à forte utilitè moyenne
sous contraintes de taille afin d'éviter les itemsets longs et rares, formés d'items
de faible poids. Les expérimentations montrent qu'il tire en quelques secondes
des milliers de motifs à forte utilité moyenne sur différents jeux de données.