Implémentation et expérimentation d’une méthode de propagation des termes en utilisant de différentes formules de pondération

Loading...
Thumbnail Image

Date

2013

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

La nature de sources d’information évolue, et les documents numériques traditionnels plats ” ne contenant que du texte s’enrichissent d’information structurelle et multimédia. Cet évolution est accélérée par l’expansion du Web, et les documents semistructurés de type XML (eXtensible Markup Language) tendent à former la majorité des documents numériques mis disposition des utilisateurs. Le développement d’outils automatisés permettant un accès efficace à ce nouveau type d’information numérique apparaît comme une nécessité. Afin de valoriser au mieux l’ensemble des informations disponibles, les méthodes existantes de Recherche d’Information (RI) doivent être adaptées. L’information structurelle des documents peut en effet servir à affiner le concept de granule documentaire. Le but pour les Systèmes de Recherche d’Information (SRI) est alors de retrouver des unités d’information (et non plus de documents) pertinentes à des requêtes utilisateur. Afin de répondre à cette problématique fondamentale, de nouveaux modèles prenant en compte l’information structurelle des documents, tant au niveau de l’indexation, de l’interrogation que de la recherche doivent être construits. L’objectif de nos travaux est d’implémenter une methode permettant d’effectuer des recherches dans des corpus de document semi-structurés. Ceci nous a conduits à concevoir un modèle de recherche d'information dans les documents semi-structurés. Ce modèle a pour but de trouver les unités d’information les plus exhaustives, spécifiques et plus informatif répondant à une requête utilisateur. Les documents semi-structurés peuvent être représentés sous forme arborescente, et le but est alors de trouver les sous-arbres de taille minimale, qui représenterait au mieux le document XML. Pour ce faire, Le modèle implémente une méthode de propagation des termes et de leur poids dans l'arbre en utilisant des formules de pondération. L'évaluation de ce modèle montre l'intérêt de la méthode implémentée, à savoir la méthode de propagation des termes et les résultats des tests des formules de pondération utilisées.

Description

141 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

XML, XFIRM, Recherche d'information, Documets structurés, formules de pondération, INEX

Citation

Systéme Informatique