Résumé:
Les entrepôts de données ont pris une place importante dans les préoccupations des utilisateurs des bases de données, L'idée pour la mise en oeuvre d'un entrepôt de données est de fournir un accès permanent aux données même lorsque les bases de données individuelles sont inaccessibles, et de réduire les accès distants aux systèmes gérant les données d'origine. Les entrepôts de données sont dédiés aux applications d'analyse et de prise de décision. Le processus d'analyse est réalisé à l'aide de requêtes complexes comportant de multiples jointures et des opérations d'agrégation sur des tables volumineuses, L'administrateur, dans le but de minimiser le coût d'exécution de ces requêtes, sélectionne un ensemble de vues matérialisées qui représentent les noeuds de jointure. Cette sélection diminue le coût des requêtes, mais entraîne le problème d’occupation de place pour les vues matérialisées, et en conséquence, ils ne peuvent pas être stockés en totalité dans la mémoire centrale. Le travail présenté dans ce mémoire concerne l’optimisation des requêtes dans l’entrepôt de données, plus particulièrement la technique des vues matérialisées. Un important problème d’optimisation a été suggéré dans cette technique, la sélection de vues. le problème consiste à sélectionner l’ensemble des vues à matérialiser pour accélérer dans le futur l’exécution des requêtes. Ce mémoire propose une solution à ce problème par l’utilisation des techniques du data-mining, plus précisément l’algorithme de classification k-means.