Résumé:
La reconnaissance des entités nommées fait aujourd’hui figure d’incontournable en Traitement Automatique des Langues est basé sur des règles linguistiques qui exploitent l’étiquetage syntaxique, des déclencheurs et des dictionnaires de noms propres. La tache de reconnaissance et de catégorisation des noms de personnes, de lieux, d’organisations, etc.
Notre rapport présente les différentes étapes à utiliser de la conception d’un Système de recherche d’entités nommées sur Wikipédia.
Ce système s’appuie sur la classification des entités nommées par année, catégorie et par langue est il est basé sur la méthode et
l’entropie de Shannon.