Une méthode d'apprentissage par optimisation multicritère pour le rangement de motifs en fouille de données
Résumé
La découverte de motifs pertinents est une tâche difficile en fouille de
données. D'une part, des approches ont été proposées pour apprendre automatiquement
des fonctions de rangement de motifs spécifiques à l'utilisateur. Ces
approches sont souvent efficaces en qualité, mais très coûteuses en temps d'exécution.
D'autre part, de nombreuses mesures d'intérêt sont utilisées pour évaluer
l'intérêt des motifs dans le but de se rapprocher le plus possible du rangement
de l'utilisateur. Dans cet article, nous formulons le problème d'apprentissage des
fonctions de rangement des motifs comme un problème d'optimisation multicritère.
L'approche proposée permet d'agréger des mesures d'intérêt en une fonction
linéaire pondérée dont les poids sont calculés via la méthode AHP (Analytic
Hierarchy Process). Des expérimentations menées sur de nombreux jeux de données
montrent que notre approche réduit drastiquement le temps d'exécution,
tout en assurant un rangement comparable à celui des approches existantes.