Classification des données non équilibrées

dc.contributor.authorTabet, Salah eddine
dc.date.accessioned2018-02-28T08:54:46Z
dc.date.available2018-02-28T08:54:46Z
dc.date.issued2015
dc.description.abstractDans ce mémoire, on a étudié le problème de la classification des données non équilibrées. En effet, le biais de données affecte et dégrade les performances des classifieurs. On a choisis des bases de données du domaine médicales. Trois méthodes ont été testées pour équilibrer les données (suréchantillonage, souséchantillonage , hybride ). Pour la tache de classification, trois algorithmes ont été appliqués et évaluer (le naive bayésien, le plus proche voisin, les arbres de décisions).Les résultats montrent que le meilleur algorithme de classification de ces bases de données dans le domaine médicale est l’arbre de décision qui performe mieux que les autres, et la meilleur méthode d’échantillonage est le sur échantillonnage avec SMOTE .en_US
dc.identifier.urihttp://dspace.univ-msila.dz:8080//xmlui/handle/123456789/3264
dc.language.isofren_US
dc.publisherFACULTE DES MATHEMATIQUES ET DE L’INFORMATIQUE - UNIVERSITE DE M’SILAen_US
dc.subjectClassification supervisé, Imbalanced Data, SMOTE, oversampling, undersampling, Data Mining.en_US
dc.titleClassification des données non équilibréesen_US
dc.typeThesisen_US

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Tabet Salah eddine..rar
Size:
582.18 KB
Format:
Unknown data format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections