Quand les sous-groupes rencontrent les graduels : découverte de sous-groupes identifiant des corrélations exceptionnelles
Résumé
La découverte de sous-groupes permet d'identifier des ensembles d'ob-
jets définis en intention qui sont intéressants vis-à-vis d'une mesure de qualité
impliquant un ou plusieurs attributs cibles (par exemple motifs discriminants
pour une variable de classe). Dans cet article nous proposons une approche pour
un nombre quelconque (≥ 2) d'attributs cibles numériques. Pour cela, nous nous
appuyons sur l'exploration conjointe de motifs graduels identifiant des corréla-
tions de rang et de sous-groupes afin d'identifier des contextes pour lesquels
les corrélations décrites par les motifs graduels sont exceptionnellement fortes
par rapport au reste des données. Nous présentons un algorithme d'énumération
s'appuyant sur des propriétés d'élagage avec des bornes supérieures. Une étude
empirique sur plusieurs jeux de données démontre la pertinence et l'efficacité de
notre méthode.