Critère VT100 de sélection des règles d'association
Abstract
L'extraction de règles d'association génère souvent un grand nombre
de règles. Pour les classer et les valider, de nombreuses mesures statistiques
ont été proposées ; elles permettent de mettre en avant telles ou telles caractéristiques
des règles extraites. Elles ont pour point commun d'être fonction
croissante du nombre de transactions et aboutissent bien souvent à
l'acceptation de toutes les règles lorsque la base de données est de grande
taille. Dans cet article, nous proposons une mesure inspirée de la notion de valeur-
test. Elle présente comme principale caractéristique d'être insensible à la
taille de la base, évitant ainsi l'écueil des règles fallacieusement significatives.
Elle permet également de mettre sur un même pied, et donc de les comparer,
des règles qui auront été extraites de bases de données différentes. Elle permet
enfin de gérer différents seuils de signification des règles. Le comportement de
la mesure est détaillé sur un exemple.