Résumé:
Les bases de données lexicales jouent un rôle important dans plusieurs
domaines du traitement automatique des langues (TAL), comme l’extraction
d’information, la reconnaissance d’entités nommées. La reconnaissance des entités
nommées (REN) consiste à identifier des entités nommées (EN) dans des ressources
textuelles et les classer en catégories prédéfinies.
Ce rapport présente les différentes étapes de la conception d’un système de
recherche d’entités nommées arabe sur Wikipédia. Ce système s’appuie sur la
reconnaissance des entités nommées arabe à l’aide d’un dictionnaire électronique
relationnel multilingue de nom propres qui s’appelle prolexbase.