Résumé:
L’analyse multidimensionnelle basée sur les bases de données multidimensionnelles « BDM » factuelles numériques est une tâche bien maîtrisée de nos jours. Ces BDM sont souvent construites sur des données transactionnelles issues des systèmes d’information (SI) des entreprises « les entrepôts de données ». Cependant, seules 20% des données d’un SI sont des données transactionnelles et peuvent être traitées. Les 80% restants, la « paperasserie électronique », restent hors de portée de la technologie OLAP faute d’outils et de méthodes adaptées à la gestion de données textuelles. Ne pas prendre en compte ces données mène inévitablement à l’omission d’informations pertinentes durant un important processus de prise de décision voire l’inclusion de données non pertinentes générant ainsi des analyses approximatives ou erronées. Dans le contexte de ces travaux, nous nous sommes focalisés sur les deux notions qui sont l'intégration des entrepôts textuels et leur modélisation multidimensionnelle. Pour mettre en place une solution d'intégration de ce type de données, nous avons eu recours aux techniques de recherche d'information (RI) et du traitement automatique du langage naturel (TALN).