Résumé:
Ce projet décrit l’étude et la réalisation des modèles d’apprentissage automatique conçu
pour l’évaluation des sentiments des corpus. Un tel modèle permet:
· la recherche automatique des critiques sur Internet,
· la classification des opinions en utilisant des méthodes d’apprentissage automatique
supervisé non supervisé.
· l’évaluation et la notation des opinions des critiques.
La partie la plus intéressante au niveau de ce mémoire est la notation automatique des
sentiments. Pour cette partie nous avons présenté trois approches différentes pour effectuer la
classification des sentiments. Nous avons cité les approches suivantes :
· l’approche linguistique,
· l’approche statistique,
· l’approche hybride.
L’objectif de ce travail était d’étudier, expérimenter et comparer différents clssificateurs.
Nous avons implémenté une application permettant de tester deux classificateurs : SVMLight
et Naïve Bayésien sur, En les appliquant sur deux corpus d’opinions, nous avons opté à
effectuer l’indexation par mot ou bien l’indexation par phrase après un paramétrage
standard via un fichier XML. Chaque corpus indexé, peut être par la suite classifié selon un
modèle avant d’être évalué. Cette évaluation est basée sur deux métriques principales
(précision, rappel).
Les outils d’analyse offerts par notre application permettent d’apprécier les performances
d’un modèle sur différents corpus de tests. Nous estimons que, par ce modeste travail, nous
avons pu déblayer le terrain dans un domaine très intéressant et d’actualité en vue pouvoir
suivre les opinions du grand public dans les blogs et les réseaux sociaux et bien même
d’améliorer les systèmes de veille stratégique dans l’entreprise.