Modélisation et extraction des liens complexes entre variables. Application à des données socio-économiques
Résumé
Nous nous intéressons ici à un type particulier de complexité qui est
celle des liaisons entre variables. Il existe des modèles statistiques qui ont été
construits pour traiter certains aspects de cette complexité. Ainsi le modèle linéaire
général (Azaïs et Bardet 2005) permet de rendre compte d'aspects spécifiques
de la complexité comme les interactions d'ordre quelconque, les liaisons
négatives au même titre que les positives, et les « contrastes ». Mais ces
méthodes sont mal adaptées au cas d'un grand nombre de variables et elles
exigent une explicitation a priori des liaisons en jeu. Nous présentons notre
méthode MIDOVA qui extrait directement des données le même type de liaisons
que le modèle linéaire général, sans nécessiter d'hypothèses contraignantes,
tout en étant compatible avec un grand nombre de variables, pour l'instant
qualitatives. Nous l'illustrons en l'appliquant à des données issues de l'enquête
PAPFEM, réalisée en 2001 par l'Office National de la Famille et de la Population
en Tunisie, et nous mettons au jour le lien particulièrement complexe entre
la pauvreté du ménage et la situation socio-économique des deux conjoints.