Interrogation des résumés de flux de données
Résumé
Les systèmes de gestion de flux de données (SGFD) ont été conçus
afin de traiter une masse importante de données produites en ligne de façon
continue. Etant donné que les ressources matérielles ne permettent pas de conserver
toute cette volumétrie, seule la partie récente du flux est mémorisée dans la
mémoire du SGFD. Ainsi, les requêtes évaluées par ces systèmes ne peuvent porter
que sur les données les plus récentes du flux. Par conséquent, les SGFD actuels
ne peuvent pas traiter des requêtes qui portent sur des périodes très longues.
Nous proposons dans cet article, une approche permettant d'évaluer des requêtes
qui portent sur une période plus longue que la mémoire du SGFD. Ces fenêtres
font appels à des données récentes et des données historisées. Nous présentons
le niveau logique de cette approche ainsi que son implantation sous le SGFD Esper.
Une technique d'échantillonnage associée à une technique de fenêtre point
de repère est appliquée pour conserver une représentation compacte des données
du flux.