Résumé:
dans di érents domaines liés à la vision par ordinateur, tels que la reconnaissance de formes, l’imagerie
médicale, la vidéosurveillance, l’analyse des mouvements, etc. Généralement, les caractéristiques visuelles
de l’image, telles que la couleur, la texture et la forme sont utilisées pour identi er le contenu des images.
Cependant, lors de l’utilisation de bases de données volumineuses Big Data, ce processus devient très
consommateur en ce qui concerne le temps de recherche et l’espace de stockage. La précision risque
d’être dégradée si les algorithmes utilisés ne sont pas capables d’extraire et de sélectionner la bonne
information à partir des bases de données volumineuses. Pour faire face à ces contraintes, nous proposons
dans ce travail une nouvelle méthode de recherche et d’indexation de gros volumes d’images et de
vidéos (Big Data) o rant à la fois une précision élevée, un temps d’exécution rapide, une réduction de la
dimensionnalité ainsi qu’une exploitation e cace des ressources distribuées avec les technologies du
Big Data.
Nous avons proposé, dans nos travaux de thèse, deux principakes contributions, la première porte sur
l’accélération de la recherche de données volumineuses avec une réduction de l’espace de stockage sans
perte de précision. Cette contribution se résume en quatre points : 1. indexation des vidéos par des
images clés ; 2. réduction de dimensionnalité des descripteurs de grandes bases d’images (Big Data) ;
3. réduction du temps de recherche à travers des méthodes d’indexation par approximation (VA-File)
et des algorithmes de stockage de descripteurs (arbres binaires) ; 4. amélioration de la précision de la
recherche en utilisant les descripteurs extraits à partir des méthodes d’apprentissage profond (Deep
Learnig) avec une réduction de dimensionnalité de ces descripteurs.
La deuxième contribution consiste à exploiter de manière e cace les technologies du Big Data pour
o rir une implémentation parallèle et distribuée des algorithmes décrits ci-dessus (première contribution).
Les technologies de Hadoop et Map Reduce sont adaptées pour exploiter les processeurs graphiques
(GPUs) de manière simultanée avec les processeurs centraux (CPUs).
Les expériences liés à l’indexation d’images ont été menées avec six bases de données de tailles di érentes
(petites, moyennes et volumineuses). Par ailleurs, les expériences portant sur l’indexation de vidéos
ont été menés avec deux bases de données de tailles di érentes (petite, grande). Ces résultats ont
montré une amélioration signi cative du temps de recherche avec un taux d’accélération allant de 30%
à 40%. L’espace de stockage de données a également été réduit avec un facteur allant de 15% à 20%
tout en gardant une précision élevée. D’autre part, l’utilisation des technologies du Big Data avec des
architectures Multi-CPU/Multi-GPU a permis d’accélérer le processus de recherche dans des bases de
données volumineuses avec un facteur allant de 30 à 40. Grâce à ces accélérations, la consommation
d’énergie a été réduite avec un facteur d’environ 20%.