Résumé:
Avec l'avènement des réseaux sociaux sur le WEB, L'analyse de sentiments est
apparue comme l'un des nouveaux défis en traitement automatique des langues. Il s'agit d'une
tâche difficile et très importante qui implique le traitement des langues naturelles et
l'apprentissage machine.
Par rapport à l'analyse de sentiments dans la plupart des langues latines, la langue
arabe est plus difficile à analyser en raison de sa complexité morphologique, ses particularités
et la grande variation de ses dialectes. Il est donc nécessaire de proposer des solutions et de
développer des programmes de catégorisation à l'aide de différentes techniques de
classification.
Dans notre projet nous avons adapté une approche qui se base sur la méthode de
fouille de données à savoir la classification ainsi que ses techniques qui s‟inspirent de la
biologie en l‟occurrence les algorithmes bio inspirés, sur un ensemble de données public:
AJGT (Arabic Jordanian Géneral Tweet). Ce travail nécessite deux phases. La première est la
phase de prétraitement, qui comprend les étapes de Nettoyage des données, Normalisation,
Tokenization, Suppression des mots vides, stemming. La seconde est l‟application des trois
classificateurs : Support Vector Machines (SVM), Random Forest (RF), K Nearest Neighbors
(KNN).Et la sélection d'attributs à l'aide de trois techniques différentes: inspirée de la
génétique (Algorithm genetic AG), basée sur l‟imitation du comportement des faucons (Harris
Hawks Optimizer HHO), et basée sur l‟imitation du comportement des loups gris (Grey Wolf
Optimizer GWO).
D‟après notre étude, l‟AG à base du classifieur k-NN a montré une meilleure
performance pour la classification des opinions en termes d‟accuracy, précision, Taux de
rappel et F-score.