Utilisation des règles d'association pour la prédiction de valeurs manquantes
Abstract
Le traitement des valeurs manquantes est une problématique importante
dans le domaine des entrepôts de données. Plusieurs solutions ont été proposées
pour la prédiction de valeurs manquantes, présentant les caractéristiques
suivantes : (i) la prédiction traite soit des valeurs continues soit des valeurs discrètes,
et (ii) la prédiction est approximative (soit elle est associée à une probabilité
soit elle concerne un ensemble de valeurs). Récemment, une méthode
de prédiction permettant de traiter indépendamment les cas continu et discret a
été proposée, en se basant sur les règles d'association. Cette méthode permet de
prédire, avec une confiance toujours égale à 1, soit un ensemble de valeurs dans
le cas discret, soit un intervalle de valeurs dans le cas continu.
Dans cet article, nous reprenons cette approche basée sur l'extraction de règles
d'association et nous montrons comment générer des règles de prédictions
portant sur une unique valeur et dont la confiance est toujours égale à 1. Afin
d'obtenir de telles règles, notre méthode suppose que l'on dispose d'une hiérarchie
décrivant des concepts généralisant les valeurs qui peuvent être prédites.