Extraction de règles d’associations entre les concepts biomédicaux.

Loading...
Thumbnail Image

Date

2013

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

Ce mémoire traite la problématique de l’extraction des règles d’association dans le corpus textuel extrait de MedeLine. En effet, avec l'avènement de l'informatique et l'augmentation de données stockées sur des supports informatiques, qui peuvent cacher des liens et des corrélations pertinentes, la conception et la mise en oeuvre des outils de Text Mining deviennent nécessaire. On introduisant le Data Mining qui est la source de Text Mining, la premier chapitre de ce mémoire est consacrée à la présentation et la définition de Text Mining et les différentes notions et techniques qui le constituent et qui interviennent dans le développement de notre projet. Dans le deuxième chapitre, nous exposons les différentes caractéristiques des règles d'association et les algorithmes utilisés pour leur extraction. Et le troisième chapitre est consacré à la description de notre approche qui a comme objectif l’extraction de règles d’association à partir d’un corpus textuel extrait de MedeLine. Et enfin, le dernier chapitre est consacré à la présentation du système développé ainsi qu'à l’interprétation des différents résultats obtenus par l'analyse d'un ensemble de documents biomédicale. De la manière la plus simple, la chaîne de traitement de notre système se déroule en deux phases. La première partie consiste à faire l’extraction des concepts on utilise cxtractor. Ensuite, nous utilisons les concepts obtenues dans une première partie pour générer des motifs fréquents et ça grâce à l’algorithme apriori et à partir de ses motifs on utilise l’algorithme de génération des règles d’association pour générer les relations entre les concepts. Summary: This thesis addresses the problem of extracting association rules in the textual corpus extract from Medeline. Indeed, with the advent of computers and increasing stored on computer media, which can hide the links and correlations relevant data, the design and implementation of text mining tools become necessary. On introducing the Data Mining is the source of Text Mining, the first chapter of this thesis is devoted to the presentation and the definition of Text Mining and different concepts and techniques that are involved in and the development of our project. In the second chapter, we discuss the different features of association and the algorithms used for their extraction rules. The third chapter is devoted to the description of our approach which aims extract association rules from a text corpus extract from Medeline. And finally, the last chapter is devoted to the presentation of the developed system as well as the interpretation of the different results obtained by the analysis of a set of biomedical documents. In the easiest way, the processing chain of our system is divided into two phases. The first part is to extract the concepts using cxtractor. Then we use the concepts obtained in the first part to generate frequent patterns and that thanks to the Apriori algorithm and its grounds from the generation algorithm of association rules is used to generate the relationships between concepts

Description

63 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Text mining, Data mining, Biomédicaux, Régles

Citation

Conduite De Projets Informatiques