Un algorithme de classification automatique pour des données relationnelles multi-vues
Abstract
classification automatique (De Carvalho et al., 2012) capable de partitionner
des objets en prenant en compte de manière simultanée plusieurs matrices
de dissimilarité qui les décrivent. Ces matrices peuvent avoir été générées
en utilisant différents ensembles de variables et de fonctions de dissimilarité.
Cette méthode, basée sur l'algorithme de nuées dynamiques est conçu pour fournir
une partition et un prototype pour chaque classe tout en découvrant une pondération
pertinante pour chaque matrice de dissimilarité en optimisant un critère
d'adéquation entre les classes et leurs représentants. Ces pondérations changent
à chaque itération de l'algorithme et sont différentes pour chacune des classes.
Nous présentons aussi plusieurs outils d'aide à l'interprétation des groupes et de
la partition fournie par cette nouvelle méthode. Deux exemples illustrent l'interêt
de la méthode. Le premier utilise des données concernant des chiffres manuscrits
(0 à 9) numérisés en images binaires provenant de l'UCI. Le second utilise un
ensemble de rapports dont nous connaissons une classification experte donnée à
priori.