RNTI

MODULAD
Utilisation des règles d'association pour la prédiction de valeurs manquantes
In EDA 2009, vol. RNTI-B-5, pp.76-87
Abstract
Le traitement des valeurs manquantes est une problématique importante dans le domaine des entrepôts de données. Plusieurs solutions ont été proposées pour la prédiction de valeurs manquantes, présentant les caractéristiques suivantes : (i) la prédiction traite soit des valeurs continues soit des valeurs discrètes, et (ii) la prédiction est approximative (soit elle est associée à une probabilité soit elle concerne un ensemble de valeurs). Récemment, une méthode de prédiction permettant de traiter indépendamment les cas continu et discret a été proposée, en se basant sur les règles d'association. Cette méthode permet de prédire, avec une confiance toujours égale à 1, soit un ensemble de valeurs dans le cas discret, soit un intervalle de valeurs dans le cas continu. Dans cet article, nous reprenons cette approche basée sur l'extraction de règles d'association et nous montrons comment générer des règles de prédictions portant sur une unique valeur et dont la confiance est toujours égale à 1. Afin d'obtenir de telles règles, notre méthode suppose que l'on dispose d'une hiérarchie décrivant des concepts généralisant les valeurs qui peuvent être prédites.