Approximate Integration of streaming data
Résumé
Nous présentons des algorithmes d'approximation pour les réponses à des requêtes ana-
lytiques à l'aide d'un échantillonnage par réservoir pondéré. Nous étudions les réponses aux
requêtes OLAP pour un flux de tuples t d'un Entrepôt de données, et la détection de commu-
nautés dans un flux d'arêtes d'un graphe social. Nous montrons que pour un modèle de graphe
dont le degré suit une loi de puissance et qui est concentré, l'algorithme proposé est une bonne
approximation. Bien que nous ne gardions pas les arêtes des graphes, nous approximons les
communautés et leur dynamique. Etant donné deux flux, nous définissons la Corrélation de
Communautés comme la fraction de noeuds communs aux communautés des deux graphes.
Nous approximons cette corrélation et définissons l'intégration approchée de deux flux. Nous
illustrons cette approche en analysant plusieurs flux Twitter associés à des programmes de TV.