Abstract:
Dans ce mémoire, une étude comparative est faite sur deux corpus de textes prophétiques de
Sahih Elboukhari de différent nombre de classe, dont on a appliqué les méthodes de
classification (Naive bayes, KNN et SVM), après avoir appliqué ces méthodes on a comparé
les résultats obtenus sur la base de mesures de classification (F-mesure moyenne et Accurancy).
Les résultats obtenus montrent que le meilleur algorithme de classification appliquée sur les
textes prophétiques est le SVM (Support Vector Machine) et le meilleur modèle est 3gram sans
keepterms.
Pour la classification on a utilisé l’environnement de RapidMiner.