RNTI

MODULAD
Intégration des Tableaux Multidimensionnels en Pig pour l'Entreposage de Données sur les Nuages
In EDA 2010, vol. RNTI-B-6, pp.21-34
Abstract
Les entrepôts de données et les systèmes OLAP correspondent à des technologies d'aide à la décision. Ils permettent d'analyser à la volée de gros volumes de données représentés en fonction d'un modèlemultidimensionnel. L'informatique dans les nuages, sous l'impulsion des grandes compagnies telles que Google, Microsoft ou encore Amazon, a récemment suscité une attention particulière. Considérer l'interrogation OLAP et les entrepôts de données au sein de telles infrastructures devient alors un enjeu majeur. Les problèmes devant être considérés sont ceux classiques des systèmes largement distribués (interrogation de gros volumes de données, hétérogénéité sémantique et structurelle ou encore variabilité), mais d'un nouveau point de vue devant considérer les spécificités de ces architectures (facturation à l'utilisation, élasticité et facilité d'utilisation). Dans ce papier nous abordons dans un premier temps les règles de facturation à l'utilisation pour le stockage des entrepôts de données. Nous proposons d'utiliser des techniques de stockage pour nuages à base de tableaux multidimensionnels. De premières expérimentations montrent l'intérêt de notre proposition. Ensuite, nous listons des perspectives de recherche.