Dépôt DSpace/Manakin

Prise en compte de l’énergie dans la phase d’exploitation des bases de données volumineuses

Afficher la notice abrégée

dc.contributor.author ROUKH, Amine
dc.date.accessioned 2017-06-14T09:04:01Z
dc.date.available 2017-06-14T09:04:01Z
dc.date.issued 2017-04-14
dc.identifier.uri http://hdl.handle.net/123456789/458
dc.description.abstract Résumé À l’ère du Big Data, la gestion de la consommation d’énergie par les serveurs et les centres de données est devenue un dé majeur pour les entreprises, les institutions et les pays. Parmi les applications déployées sur les centrées données, les systèmes de gestion de base de données (SGBD) sont l’un des principaux consommateurs d’énergie lors de l’exécution de requêtes complexes impliquant de très grandes taille de données. Par ailleurs, le traitement de ce type de base de données requiert des infrastructures informatiques et matérielles coûteuses et consommatrices d’énergie. Les pratiques actuelles d’utilisation et d’exploitation des bases de données extrêmement larges montrent que le coût énergétique de traitement de requête est totalement négligé par les utilisateurs et également par les concepteurs. Sachant que le facteur le plus important pour l’utilisateur est la minimisation du temps de réponse de requêtes. Dans cette thèse nous proposons une formalisation multi-objectifs des problèmes d’exploitation des bases de données, en tenant compte de deux besoins non-fonctionnels : la performance et la consommation d’énergie lors de l’exécution d’une charge de requêtes. Cette formalisation nous a permis de tirer parti des techniques avancées proposé dans l’état de l’art pour la résolution des problèmes d’optimisation multi-objectifs. Pour ce fait, tout d’abord nous développons des modèles de coût pour estimer le coût énergétique des requêtes exécutées d’une manière isolée ou parallèle. Ces modèles de coût sont ensuite intégrés dans l’un des modules les plus importants dans un SGBD, qui est le module de traitement de requêtes. La nouvelle objective de ce module est la sélection des plans d’exécution des requêtes avec le compromis désiré par les utilisateurs entre le temps et l’énergie des requêtes. De plus, nous proposons une initiative qui intègre la dimension énergétique dans la phase de conception physique des bases de données, à n de sélectionner des structures d’optimisation en prenant en compte les aspects énergétiques. Nous étudions le cas des vues matérialisées, l’une des structures d’optimisation redondantes très répondu. Dans chaque contribution de notre thèse, des expérimentations intensives sont conduites en utilisant un dispositif réel pour les mesures d’énergie et les données des benchmarks TPC-H, TPC-DS et SBB avec des diverses con gurations matérielles et logicielles---------------------------------------------------Abstract In the Big Data Era, the management of energy consumption by servers and data centers has become a challenging issue for companies, institutions, and countries. In data-centric applications, Database Management Systems are one of the major energy consumers when executing complex queries involving very large databases. Moreover, the processing of this type of database requires costly and energyintensive computing and hardware infrastructures. Current practices in the use and exploitation of extremely large databases show that the energy cost of query is totally neglected by users and also by designers. Knowing that the most important factor for the user is minimizing the response time of queries. In this thesis we propose a multi-objective formalization of the databases exploitation techniques, taking into account two non-functional requirements : the performance and the energy consumption during the execution of a queries workload. This formalization enabled us to take advantage of the advanced techniques proposed in the state-of-the-art for solving the multi-objective optimization problems. For this purpose, we rst develop cost models that estimate the energy consumption of queries executed in an isolated or parallel manner. These cost models are then integrated into one of the most important modules in a DBMS, which is the query processing module. The new objective of this module is the selection of execution plans of queries with the trade-o desired by the users between the time and the energy of the queries. Further, we propose an initiative that integrates the energy dimension in the physical design phase of databases, in order to select optimization structures taking into account the energy aspects. We study the case of materialized views, one of the redundant optimization structures heavy used by database administrator. In each contribution of our thesis, intensive experiments are conducted using a real device for the energy measurements and data of the TPC-H, TPC-DS and SBB benchmarks with various hardware and software con gurations. en_US
dc.language.iso fr en_US
dc.subject Mots-clés : E cacité énergétique, modèles de coût, traitement de requêtes, conception physique, gestion d’énergie, optimisation multi-objectifs. en_US
dc.subject Keywords : Energy e ciency, cost models, query processing, physical design, energy management, multi-objective optimization. en_US
dc.title Prise en compte de l’énergie dans la phase d’exploitation des bases de données volumineuses en_US
dc.type Thesis en_US


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Parcourir

Mon compte