Résumé:
La fouille de texte o re aux particuliers et aux entreprises un moyen d'exploiter d'une
grande quantit e d'informations. Elle a des valeurs commerciales tr es elev ees. Le dernier
d ecompte d eclare qu'il se trouve plus de dix entreprises de haute technologie o rant des produits
pour l'exploration de texte. La fouille de texte instruit aux d eveloppeurs les probl emes
de gestion de texte non structur e et d ecrit comment cr eer des outils pour l'exploration de
texte a l'aide de m ethodes statistiques standard issues de l'intelligence arti cielle et de la
recherche op erationnelle. Ces outils peuvent ^etre utilis es dans divers domaines, notamment
le droit, les a aires et la m edecine. Les sujets cl es abord es comprennent l'extraction d'information,
le regroupement, la cat egorisation de texte, la recherche sur le Web, le r esum e et
les syst emes de requ^ete en langage naturel. Ce m emoire pr esente des m ethodes qui transforme
des documents texte non structur es en une forme interm ediaire pour extraction des
informations depuis les donn ees du documents et aussi depuis Les donn ees textuelles dans
les m edias sociaux .