Extraction d'itemsets distinctifs dans les flux de données
Abstract
L'extraction d'itemsets distinctifs est un sujet de recherche récent qui
connait plusieurs algorithmes pour les données statiques (Knobbe et Ho, 2006;
Heikinheimo et al., 2007). Ces solutions ne sont toutefois pas conçues pour le
cas des flux de données, pour lesquels les temps de réponse doivent être aussi
faibles que possible. Nous considérons le problème de l'extraction d'itemsets
distinctifs dans les flux, qui peut avoir de nombreuses applications dans la sélection
de variables, la classification ou encore la recherche d'information. Nous
proposons l'heuristique IDkF (Itemsets Distinctifs dans les Flux) et des résultats
d'expérimentations en comparaison d'une technique de la littérature.