Résumé:
Avec l’avènement de l’informatique et l’accroissement du nombre de documents électroniques
stockés sur les divers supports électroniques et sur le Web, particulièrement les données textuelles,
le développement d’outils d’analyse et de traitement automatique des textes, notamment la
classification automatique de textes, est devenu indispensable, pour assister les utilisateurs, de ces
collections de documents, à explorer et à répertorier toutes ces immenses banques de données
textuelles. Ainsi la catégorisation automatique de textes, qui consiste à assigner un document à une
ou plusieurs catégories, s’impose de plus en plus comme une technologie clé dans la gestion de
l’intelligence, les résultats obtenus sont utiles aussi bien pour la recherche d’information que pour
l’extraction de connaissance soit sur internet (moteurs de recherche), qu’au sein des entreprises
(classement de documents internes, dépêches d’agences, etc.). À l'égard des différentes approches
de classification automatique de textes, décrites dans l’état de l’art, se reposant sur une architecture
classique basée sur un seul point de vue, nous avons introduit une nouvelle utilisation du classifieur
« Kppv », basée sur la détection des synonymes. L’objectif principal de nos travaux, est d’améliorer
les performances et l’efficacité du modèle de classification. Le corpus de référence Reuters, va
servir à mener une étude comparative des résultats obtenus.