Comparaison des mesures d'intérêt de règles d'association : une approche basée sur des graphes de corrélation
Résumé
Le choix des mesures d'intérêt (MI) afin d'évaluer les règles d'association
est devenu une question importante pour le post-traitement des connaissance
en ECD. Dans la littérature, de nombreux auteurs ont discuté et comparé
les propriétés des MI afin d'améliorer le choix des meilleures mesures. Cependant,
il s'avère que la qualité d'une règle est contextuelle : elle dépend à la fois de
la structure de données et des buts du décideur. Ainsi, certaines mesures peuvent
être appropriées dans un certain contexte, mais pas dans d'autres. Dans cet article,
nous présentons une nouvelle approche contextuelle mise en application
par un nouvel outil, ARQAT, permettant à un décideur d'évaluer et de comparer
le comportement des MI sur ses jeux de données spécifiques. Cette approche est
basée sur l'analyse visuelle d'un graphe de corrélation entre des MI objectives.
Nous employons ensuite cette approche afin de comparer et de discuter le comportement
de trente-six mesures d'intérêt sur deux ensembles de données a priori
très opposés : un premier dont les données sont fortement corrélées et un second
aux données faiblement corrélées. Alors que nous attendions des différences importantes
entre les graphes de corrélation de ces deux jeux d'essai, nous avons
pu observer des stabilités de corrélation entre certaines MI qui sont révélatrices
de propriétés indépendantes de la nature des données observées. Ces stabilités
sont récapitulées et analysées.