Abstract:
Les travaux de recherche présentés dans ce mémoire de thèse s’inscrivent dans le cadre des systèmes d’aide à la prise de décision. Ces systèmes se basent sur un processus d’analyse en ligne (OLAP) et structurent les données de manière multidimensionnelle. Nous avons proposé une nouvelle approche qui consiste à intégrer les données issues de documents XML au coeur du processus d’analyse. Jusqu’à présent, ces documents sont restés exclus des systèmes d’aide à la prise de décision, faute de méthode et d’outils adaptés. Selon [Tseng & Chou, 2006], les système OLAP n’emploient que 20% des données qui transitent au sein des systèmes d’information des entreprises. Les 80% restants, des documents restent hors de portée des systèmes d’aide à la prise de décision. Dans [Sullivan, 2001], l’auteur argumente en faveur de l’intégration des données issues de documents et de l’emploi de la fouille de texte pour en permettre l’analyse. De leur côté, les auteurs de [Fankhauser & Klement, 2003] affirment que la technologie XML est assez mature pour permettre l’implantation d’outils de fouilles de texte performant. Nous avons proposé d’aller au delà de ces propos en fournissant un environnement permettant l’intégration de documents XML au sein d’un système OLAP adapté pour l’analyse de données textuelles contenues dans ces documents. Il s’agit d’une première approche en vue de l’intégration de 100% des données issues des systèmes d’information des entreprises. Pour permettre l’intégration de documents au sein de l’environnement d’aide à la prise de décision, nous avons proposé un modèle multidimensionnel associé à un ensemble d’opérations pour permettre la manipulation des concepts du modèle. Nous avons proposé une démarche pour intégrer les documents au sein de l’environnement. La validation de nos propositions a été effectuée par le développement d’un prototype permettant l’analyse multidimensionnelle de données issues de documents