Régression Laplacienne semi-supervisée pour la reconstitution des dates de pose des réseaux d'assainissement
Résumé
La date de pose est souvent un facteur principal d'explication de la dégradation
des conduites d'assainissement. Pour les gestionnaires de ces réseaux,
connaître cette information permet ainsi (par l'utilisation de modèles de détérioration)
de prédire l'état de santé actuel des conduites non encore inspectées.
Cette connaissance est primordiale pour prendre des décisions dans un contexte
de forte contrainte budgétaire. L'objectif est ainsi de reconstituer ces dates de
pose à partir des caractéristiques du patrimoine et de son environnement. Les
données à manipuler présentent plusieurs niveaux de complexité importants.
Leurs sources sont hétérogènes, leur volume est important et les informations
sur leur étiquetage (dates) sont limitées : seulement 24 % du linéaire est connu
pour les réseaux d'assainissement de la métropole de Lyon. La base de données
sous-jacente contient les caractéristiques connues des conduites (profil géométrique,
matériau utilisé, etc.). Dans ce papier, nous proposons de mesurer l'effet
et l'impact de quelques méthodes d'apprentissage statistique semi-supervisé, et
de proposer ainsi une approche alternative adaptée à la reconstitution de ce type
de données.