Identification de la langue et catégorisation thématique de textes d’un corpus multilingue en utilisant les réseaux de neurones artificiels RNA

dc.contributor.authorSAHRAOUI, Safia
dc.date.accessioned2018-02-14T09:43:52Z
dc.date.available2018-02-14T09:43:52Z
dc.date.issued2013
dc.description.abstractDe nos jours, les besoins de catégorisation automatique de documents en raison de l'augmentation constante du volume d'informations accessibles électroniquement, la conception et la mise en œuvre d'outils efficaces, permettant notamment à l'utilisateur de n'avoir accès qu'à l'information qu'il juge pertinente, devient une nécessité absolue. Comme la plupart de ces outils sont destinés à être utilisés dans un cadre professionnel, les exigences de fiabilité et de convivialité sont très importantes ; les problèmes à résoudre pour satisfaire ces exigences sont nombreux et difficiles. Le but de nos travaux est de développer un modèle fondé sur l'apprentissage automatique pour la catégorisation multilingue de textes en utilisant la méthode de réseau de neurone artificielle, donc on peut distinguer deux grandes parties :  La catégorisation multilingue de textes.  La catégorisation thématique avec les réseaux de neurone artificielle. La structure proposée du mémoire peut être présentée comme suit : Dans le premier chapitre nous introduisons des notions générales sur les domaines de : Data Mining, Text Mining en donnant quelques définitions, les taches principales, les applications de chacun et surtout la relation entre l’apprentissage automatique et le Text Mining. Le deuxième chapitre vise à présenter le processus de la catégorisation des textes, ainsi que les difficultés liées à cette catégorisation. Le troisième chapitre est dédié à la présentation des différents algorithmes d’apprentissage automatique supervisée ainsi que leurs avantages et leurs inconvénients. Nous avons également introduit les différents moyens d’évaluation d’un classificateur. Le quatrième chapitre en mettant l’accent sur l’algorithme utilisé dans notre travail : les réseaux de neurone artificiel. Le cinquième chapitre expose les types de la catégorisation des textes multilingue, et un état de l’art qui présente en détail ce domaine. Et le dernier chapitre permettra d’évaluer les performances des différentes approches implémentées en présentant les résultats obtenus avec interprétation.en_US
dc.identifier.urihttp://dspace.univ-msila.dz:8080//xmlui/handle/123456789/2830
dc.language.isofren_US
dc.publisherFACULTE DES MATHEMATIQUES ET DE L’INFORMATIQUE-UNIVERSITE DE M’SILAen_US
dc.subjectIdentification,catégorisation thématique ,corpus multilingue ,artificiels RNAen_US
dc.titleIdentification de la langue et catégorisation thématique de textes d’un corpus multilingue en utilisant les réseaux de neurones artificiels RNAen_US
dc.typeThesisen_US

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
SAHRAOUI Safia.rar
Size:
1.76 MB
Format:
Unknown data format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections