Proposition et experimentation d'un modéle de langue pour la recherche d'information dans les documents XML.

Loading...
Thumbnail Image

Date

2015

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

L'objectif principal d'un SRI, dans le cadre de la RI classique, est de retrouver le document répondant à une requête utilisateur donnée. Dans la cadre de la RI dans les documents xml, un SRI doit retourner l'élément correspondant à une requête utilisateur, en se basant sur une collection de documents XML à contenu textuel et structurel. Quelque soit le domaine de la RI, cette dernière se base sur l'un des modèles d'une taxonomie riche, dans le but d'établir un appariement document/requête dans le cas de la RI classique, ou élément/requête dans le cas de la RI dans les documents xml. Dans ce travail, nous nous sommes intéressés au modèle probabiliste : le modèle de langue, dans le cadre de la RI dans les documents xml. Les premières applications de ce modèle été dans la linguistique informatique, puis des auteurs ont prouvé son applicabilité au domaine de la RI, tout en présentant des approches appropriées pour le modèle de langue dans la RI classique. Dans le chapitre II, nous avons constaté les paramètres pris en compte pour adapter ou proposer des approches de recherche par le modèle de langue, à la nouvelle granularité d'information xml. Notre contribution est d'adapter une approche de recherche par modèle de langue, se basant sur la taille d'un document, dans le cadre de la RI classique [Achmoukh, 2006] à la nouvelle granularité d'information. Nous avons montré les paramètres pris en compte dans l'adaptation, pour en suite établir les nouvelles probabilités de similarité que nous avons proposé. Notre approche est appliquée à un exemple de recherche dans les documents xml, dans le chapitre III, puis implémentée, testée et évaluée dans le chapitre IV, nous avons aussi comparé les résultats obtenus à des résultats obtenus par le système XFIRM [Sauvagnat, 2005] et nous avons montré les améliorations effectuées par rapport à ce système.

Description

132 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Recherche d'information, XML, Modèle de langue, Taille de document, taille de l'élément

Citation

Systéme Informatique