Approche ensemble pour le co-clustering par blocs sur des données textuelles: Application au biomédical
Résumé
Nous proposons un co-clustering par blocs via une approche ensemble
qui fusionne plusieurs co-clusterings élémentaires en une matrice d'affinité consensus
structurée. Les co-clusterings de base sont issus des mêmes données textuelles
et générés par la même méthode de co-clustering. Ce processus de fusion
renforce la qualité individuelle des co-clusterings par blocs au sein d'une seule
matrice consensus. Notre approche permet un co-clustering complètement non
supervisé, où le nombre de co-clusters est automatiquement déduit d'un critère
de modularité non trivial généralisé. La fonction objective associée permet l'apprentissage
conjoint de l'agrégation des co-clusterings élémentaires et du coclustering
consensus. Les résultats expérimentaux sur plusieurs jeux de données
réelles démontrent l'intérêt de notre approche comparée à des méthodes compétitives
de co-clustering (Affeldt et al., 2020).