Méthode ensemble de clustering profond
Résumé
Plusieurs stratégies de classification non supervisée combinant des algorithmes
de clustering classiques et les auto-encodeurs ont été étudiées. Ces
stratégies améliorent généralement les performances de clustering, mais dépendent
des données et des hyperparamètres choisis qu'on ne peut fixer en amont
pour un apprentissage non supervisé. Pour atténuer l'impact de la configuration
des hyperparamètres sur la qualité du partitionnement, nous proposons une
approche ensemble, ne nécessitant aucun pré-entraînement, qui exploite le clustering
spectral et les forces de l'auto-encodeur. Notre approche génère plusieurs
encodages profonds à partir des données d'origine, construit une matrice d'affinité
consensus clairsemée et de faible dimension via la stratégie des anchors puis
applique la classification spectrale pour obtenir l'espace commun partagé par les
encodages. La stratégie des anchors assure une représentation efficace des encodages
et leur fusion permet d'atténuer les problèmes d'hyperparamètres (Affeldt
et al., 2020).