RNTI

MODULAD
Construction de variables à l'aide de classifieurs comme aide à la régression : une évaluation empirique
In EGC 2022, vol. RNTI-E-38, pp.217-224
Résumé
Cet article propose une méthode de création automatique de variables (pour la régression) qui viennent compléter les informations contenues dans le vecteur initial des variables explicatives. Notre méthode fonctionne comme une étape de prétraitement dans laquelle les valeurs continues de la variable a régresser sont discrétisées en un ensemble d'intervalles ce qui permet de définir des seuils de valeurs. Ensuite, des classifieurs sont entraînés pour prédire si la valeur à régresser est inférieure ou égale à chacun de ces seuils. Les sorties des classifieurs sont ensuite concaténées sous la forme d'un vecteur additionnel qui vient enrichir le vecteur initial de variables explicatives natives du problème de régression. Le système implémenté peut donc être considéré comme un outil de prétraitement générique. Nous avons testé la méthode d'enrichissement proposée avec 5 types de régresseurs et l'avons évalué dans 33 jeux de données de régression. Nos résultats expérimentaux confirment l'intérêt de l'approche.