Sur l'utilisation conjointe de la régression sur composantes principales et des ondelettes
Résumé
La régression sur composantes principales (RCP) est une régression sur les facteurs d'une ACP préalablement effectuée sur des variables initialement corrélées. L'utilisation de l'ACP permet de remplacer les variables initiales, par des composantes principales qui conservent la quasi-totalité de l'information, et qui présentent l'avantage d'être non corrélées. Ces composantes, sont prises comme variables explicatives pour une régression linéaire multiple. La qualité de la modélisation par RCP reste affectée par l'existence de bruit dans les variables initiales. Nous proposons dans ce travail un débruitage des données par ondelettes (wavelets) permettant de séparer le signal du bruit sans perte d'information. Nous montrons, sur des données boursières françaises, que l'élimination du bruit sur les composantes principales par un seuillage doux à base d'ondelettes améliore la qualité d'ajustement du modèle de régression ainsi que la qualité des prévisions. Nous confirmons le résultat par simulation.