Co-clustering de données mixtes à base des modèles de mélange
Résumé
La classification croisée (co-clustering) est une technique non super-
visée qui permet d'extraire la structure sous-jacente existante entre les lignes et
les colonnes d'une table de données sous forme de blocs. Plusieurs approches
ont été étudiées et ont démontré leur capacité à extraire ce type de structure dans
une table de données continues, binaires ou de contingence. Cependant, peu de
travaux ont traité le co-clustering des tables de données mixtes. Dans cet article,
nous étendons l'utilisation du co-clustering par modèles à blocs latents au cas
des données mixtes (variables continues et variables binaires). Nous évaluons
l'efficacité de cette extension sur des données simulées et nous discutons ses
limites potentielles.