RNTI

MODULAD
Entrepôt de Données dans l'ère Data Science : De la Donnée au Modèle
In EDA 2016, vol. RNTI-B-12, pp.65-80
Résumé
Dans l'ère Data Science, un nombre important de domaines scientifiques souhaitent analyser leurs données. Souvent dans ces domaines, les données des tests sont représentées par des séries chronologiques. Ces dernières sont une classe de données temporelles, comprenant un enregistrement chronologique de valeurs, considérées comme un tout et non comme une liste de données individuelles et indépendantes. De plus, les séries chronologiques sont généralement composées d'un grand nombre de valeurs et peuvent être stockées dans des bases de données classiques, parfois en très grande quantité. Dans cet article, nous proposons un moyen de stockage des séries chronologiques, par abstraction de la série par son modèle (équation différentielle), conduisant ainsi à la notion nouvelle d'entrepôt de modèles ayant pour but de proposer une autre représentation des séries chronologiques et une solution alternative de stockage. Cependant, cette méthode induit un coût non-négligeable en temps de calcul. Notre proposition est implémentée et validée en utilisant des données réelles issues des expérimentations du domaine de l'automatique.