Entrepôt de Données dans l'ère Data Science : De la Donnée au Modèle
Résumé
Dans l'ère Data Science, un nombre important de domaines scientifiques
souhaitent analyser leurs données. Souvent dans ces domaines, les données
des tests sont représentées par des séries chronologiques. Ces dernières
sont une classe de données temporelles, comprenant un enregistrement chronologique
de valeurs, considérées comme un tout et non comme une liste de
données individuelles et indépendantes. De plus, les séries chronologiques sont
généralement composées d'un grand nombre de valeurs et peuvent être stockées
dans des bases de données classiques, parfois en très grande quantité. Dans cet
article, nous proposons un moyen de stockage des séries chronologiques, par
abstraction de la série par son modèle (équation différentielle), conduisant ainsi
à la notion nouvelle d'entrepôt de modèles ayant pour but de proposer une autre
représentation des séries chronologiques et une solution alternative de stockage.
Cependant, cette méthode induit un coût non-négligeable en temps de calcul.
Notre proposition est implémentée et validée en utilisant des données réelles
issues des expérimentations du domaine de l'automatique.