Échantillonnage de motifs d'intervalles selon la fréquence
Résumé
L'échantillonnage de motifs est une approche récente pour mener à
bien un processus de découverte de motifs en limitant le nombre de motifs produits
et en favorisant l'interactivité avec l'analyste. Le principe est de tirer aléatoirement
un motif proportionnellement à un intérêt donné, par exemple la mesure
de fréquence. Dans cet article, nous proposons FIPS, la première méthode
d'échantillonnage de motifs d'intervalles à partir de données numériques. FIPS
s'appuie sur le principe des approches en plusieurs étapes (Boley et al.). Avec
des données numériques, la difficulté majeure est de déterminer le nombre exact
de motifs d'intervalles couvrant un objet. Nous montrons formellement que FIPS
tire des motifs d'intervalles proportionnellement à la fréquence. Les expérimentations,
répondant à plusieurs questions de recherche, montrent la qualité des
motifs tirés par FIPS pour la découverte d'information.