Résumé:
Le travail présenté dans ce rapport s’intéresse à l’étude de l’extraction des informations à
partir du texte en arabe (plus spécifiquement le sacré coran). La reconnaissance d’entités
nommées est une composante essentielle du traitement du langage naturel, permettant
l’extraction d’informations et la découverte de connaissances à partir de textes. Notre intérêt
porte sur une langue à morphologie complexe, l’arabe, qui présente de grands défis en
traitement automatique des langues naturelles. Généralement, les études réalisées concernant
l’extraction de l’information à partir du texte ont été développées en anglais et dans certaines
langues. Cependant, peu d’études ont été développées en langue arabe. Pour cela, la langue
arabe doit effectuer plus de recherches dans ce domaine. Dans le cadre de ce travail, une
étude sur l’extraction d’information à partir du texte arabe a été réalisée en se basant sur
l’extraction des motifs en utilisant les techniques d’apprentissage machine.