Analyse flexible dans les entrepôts de données : quand les contextes s'en mêlent
Abstract
En autorisant l'observation des données à plusieurs niveaux de précision,
les hiérarchies occupent une place importante dans les analyses d'entrepôts
de données. Malheureusement, les modèles d'entrepôts existants ne considèrent
qu'un sous-ensemble restreint des types possibles de hiérarchie. Par exemple, il
n'est pas possible de modéliser le fait que le caractère “faible”, “normal” ou
“élevé” de la tension artérielle d'un patient (qui constitue une hiérarchisation de
la mesure) dépend de son âge (élément lié à la dimension). Ces hiérarchies, dites
contextuelles, ont récemment été introduites dans des travaux précédents. Dans
cet article, nous proposons la première approche pour les modéliser. Une base
experte représentant la connaissance du domaine est créée. Ensuite, un algorithme
de réécriture de requêtes est proposé pour permettre une analyse flexible,
efficace et adéquate d'un entrepôt possédant de telles hiérarchies. Par exemple,
il est désormais possible de répondre à la requête “Quels patients ont eu une
tension faible au cours de la nuit?” en prenant en compte de manière adéquate
les contextes associés au caractère “faible” de la mesure tension.