RNTI

MODULAD
K-Spectral Centroïd pour des données massives
In EGC 2017, vol. RNTI-E-33, pp.129-140
Résumé
Nous nous intéressons à la classification non supervisée de séries chro- nologiques. Pour ce faire, nous utilisons l'algorithme K-Spectral Centroïd (K- SC), une variante des K-Means. K-Spectral Centroïd utilise une mesure de dis- similarité entre séries chronologiques, invariante par translation et par change- ment d'échelle. Cet algorithme est coûteux en temps de calcul : lors de la phase d'affectation, il nécessite de tester toutes les translations possibles pour identifier la meilleure ; lors de la phase de représentation, le calcul du nouveau barycentre nécessite l'extraction de la plus petite valeur propre d'une matrice. Nous propo- sons dans ce travail trois optimisations de K-SC. L'identification de la meilleure translation peut être réalisée efficacement en utilisant la transformée de Fou- rier discrète. Chaque matrice peut être calculée incrémentalement. Le calcul du nouveau barycentre peut s'effectuer à moindre coût grâce à la méthode de la puissance itérée. Ces trois optimisations fournissent exactement la même classi- fication que K-SC.