K-Spectral Centroïd pour des données massives
Résumé
Nous nous intéressons à la classification non supervisée de séries chro-
nologiques. Pour ce faire, nous utilisons l'algorithme K-Spectral Centroïd (K-
SC), une variante des K-Means. K-Spectral Centroïd utilise une mesure de dis-
similarité entre séries chronologiques, invariante par translation et par change-
ment d'échelle. Cet algorithme est coûteux en temps de calcul : lors de la phase
d'affectation, il nécessite de tester toutes les translations possibles pour identifier
la meilleure ; lors de la phase de représentation, le calcul du nouveau barycentre
nécessite l'extraction de la plus petite valeur propre d'une matrice. Nous propo-
sons dans ce travail trois optimisations de K-SC. L'identification de la meilleure
translation peut être réalisée efficacement en utilisant la transformée de Fou-
rier discrète. Chaque matrice peut être calculée incrémentalement. Le calcul du
nouveau barycentre peut s'effectuer à moindre coût grâce à la méthode de la
puissance itérée. Ces trois optimisations fournissent exactement la même classi-
fication que K-SC.