RNTI

MODULAD
Echantillonnage d'itemsets à forte utilité moyenne sous contraintes de taille
In EGC 2022, vol. RNTI-E-38, pp.209-216
Résumé
Les algorithmes d'extraction d'High-Utility Itemset (HUI) sont des méthodes permettant de découvrir des connaissances dans une base de données où les items sont pondérés. Leur importance a été largement démontrée dans de nombreuses applications réelles. Dans cet article, nous proposons un algorithme nommé HAISAMPLER qui échantillonne des itemsets à forte utilitè moyenne sous contraintes de taille afin d'éviter les itemsets longs et rares, formés d'items de faible poids. Les expérimentations montrent qu'il tire en quelques secondes des milliers de motifs à forte utilité moyenne sur différents jeux de données.