Résumé:
La principale caractéristique des requêtes définies sur un entrepôt de données relationnel est le fait que leurs jointures passent systématiquement par la table de faits. Cette situation favorise l’interaction entre les requêtes. Cette interaction a été largement exploitée par les algorithmes d’optimisation de requêtes dans l’entrepôt de données, connue sous le nom d’optimisation multi-requêtes, mais n’est pas exploitée pour faire la fragmentation, et c’est notre problématique.
Dans ce travail, nous nous intéressons à la recherche des prédicats des sélections d’un schéma de l’entrepôt pour la fragmentation horizontale de l’entrepôt de données parallèle, cette fragmentation permet de réduire le temps d'exécution des requêtes et de faciliter la gestion des données de l'entrepôt. Nous présentons quelques notions de l’entrepôt de données et les techniques d'optimisation des requêtes. Nous présentons quelques travaux concernant le problème de sélection de schéma de la fragmentation horizontale de l’entrepôt de données et une synthèse pour les travaux existants dans les plateformes : centralisées, distribuées et parallèles. Comme nous détaillerons les différentes étapes de la phase de conception physique de l’entrepôt de données, le partitionnement des données de l’entrepôt avec l’utilisation de la fragmentation horizontale dérivée sur un cluster.
Nous avons proposé une approche qui permet de résoudre le problème de trouver les prédicats de la sélection qui participe à la fragmentation de l’entrepôt sur un cluster, et nous avons présenté les différentes fonctionnalités de notre application.