Un critère d'évaluation pour les K-moyennes prédictives
Résumé
L'algorithme des K-moyennes prédictives est un des algorithmes de
clustering prédictif visant à décrire et à prédire d'une manière simultanée. Contr-
airement à la classification supervisée et au clustering traditionnel, la perfor-
mance de ce type d'algorithme est étroitement liée à sa capacité à réaliser un
bon compromis entre la description et la prédiction. Or, à notre connaissance,
il n'existe pas dans la littérature un critère analytique permettant de mesurer ce
compromis. Cet article a pour objectif de proposer une version modifiée de l'in-
dice Davies-Bouldin, nommée SDB, permettant ainsi d'évaluer la qualité des ré-
sultats issus de l'algorithme des K-moyennes prédictives. Cette modification se
base sur l'intégration d'une nouvelle mesure de dissimilarité permettant d'éta-
blir une relation entre la proximité des observations en termes de distance et
leur classe d'appartenance. Les résultats expérimentaux montrent que la version
modifiée de l'indice DB parvient à mesurer la qualité des résultats issus de l'al-
gorithme des K-moyennes prédictives.