Construction de variables à l'aide de classifieurs comme aide à la régression : une évaluation empirique
Résumé
Cet article propose une méthode de création automatique de variables
(pour la régression) qui viennent compléter les informations contenues dans le
vecteur initial des variables explicatives. Notre méthode fonctionne comme une
étape de prétraitement dans laquelle les valeurs continues de la variable a régresser
sont discrétisées en un ensemble d'intervalles ce qui permet de définir
des seuils de valeurs. Ensuite, des classifieurs sont entraînés pour prédire si la
valeur à régresser est inférieure ou égale à chacun de ces seuils. Les sorties des
classifieurs sont ensuite concaténées sous la forme d'un vecteur additionnel qui
vient enrichir le vecteur initial de variables explicatives natives du problème de
régression. Le système implémenté peut donc être considéré comme un outil de
prétraitement générique. Nous avons testé la méthode d'enrichissement proposée
avec 5 types de régresseurs et l'avons évalué dans 33 jeux de données de
régression. Nos résultats expérimentaux confirment l'intérêt de l'approche.