SPAMS, une nouvelle approche incrémentale pour l'extraction de motifs séquentiels fréquents dans les Data streams
Résumé
L'extraction de motifs séquentiels fréquents dans les data
streams est un enjeu important traité par la communauté des chercheurs
en fouille de données. Plus encore que pour les bases de données, de
nombreuses contraintes supplémentaires sont à considérer de par la na-
ture intrinsèque des streams. Dans cet article, nous proposons un nouvel
algorithme en une passe : SPAMS, basé sur la construction incrémentale,
avec une granularité très fine par transaction, d'un automate appelé SPA,
permettant l'extraction des motifs séquentiels dans les streams. L'infor-
mation du stream est apprise à la volée, au fur et à mesure de l'insertion
de nouvelles transactions, sans pré-traitement a priori. Les résultats ex-
périmentaux obtenus montrent la pertinence de la structure utilisée ainsi
que l'efficience de notre algorithme appliqué à différents jeux de données.