Résumé:
L’Extraction de Connaissances à partir de Données (ECD) consiste à parcourir d’immenses
volumes de données contenues dans une base, à la recherche de connaissances. Il se décompose en plusieurs
opérations, allant de la phase de compréhension du domaine étudié jusqu’à l’interprétation des résultats, en
passant par plusieurs étapes de sélection et de préparation des données qui s’avèrent très importantes pour
garantir des résultats efficaces. La phase de prétraitement est certainement l’une des phases de préparation des
données la plus complexe. Notre travail consiste à mettre en évidence la phase de prétraitement des données,
en présentant les méthodes et techniques y afférentes. Nous décrivons et implémentons un ensemble des ces
méthodes que nous appliquons sur un extrait de données réelles.