Une approche déclarative pour le clustering explicable sous contraintes
Résumé
Le clustering est souvent considéré comme une tâche non supervisée,
exploratoire, aidant un expert à comprendre la structure de ses données. Des
contraintes fondées sur des connaissances expertes peuvent être introduites afin
d'aligner les résultats avec ses attentes. Cependant leur acquisition reste complexe,
rendant l'explication du clustering essentielle pour ajuster les paramètres
et découvrir de nouvelles informations. Nous abordons le problème du clustering
explicable en considérant deux espaces de représentation : l'un pour le
clustering et l'autre pour les explications. Notre méthode ECS (Explainabilitydriven
Cluster Selection) vise à produire un clustering de qualité, tout en étant
explicable par des motifs couvrant la majorité des instances d'un cluster et les
discriminant des autres. Elle s'appuie sur le clustering ensemble et un nouveau
modèle de programmation par contraintes (PPC) pour la sélection des clusters et
des explications.