Implémentation et évaluation d'une méthode de réordonnancement de documents se basant sur la clarté du document..

Loading...
Thumbnail Image

Date

2014

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

L’objectif fondamental de la RI consiste à mettre en oeuvre un mécanisme d’appariement entre requête utilisateur et documents d’une base afin de restituer l’information pertinente, l’accès à l’information peut être effectué a travers un système de recherche d’information (SRI). L’objectif d’un SRI est d’aiguiller la recherche dans le fond documentaire, en direction de l’information pertinente relativement à un besoin en information exprimé par une requête utilisateur. Cependant dans la majorité des SRI, uniquement le contenu textuel est utilisé pour établir la correspondance entre les documents et les requetés. D'autres caractéristiques indépendantes de la requêtes peuvent être utilisé pour l'ordonnancement a priori des documents, tel que le pagerank dans le web etc. C'est dans ce contexte que s'insère notre travail; plus précisément à exploiter la caractéristique de la clarté du document vis-à-vis de la collection en supposant qu'un document claire est a priori pertinent. L’organisation retenue pour la présentation de notre travail s’articule en trois chapitres. Dans le chapitre 1 nous décrivons deux points essentiels. Tout d’abord, nous donnons les concepts de base de la recherche d’information. On y trouve les notions de requête, de document, de collection et de pertinence et le processus d’indexation. Nous décrivons aussi les différents modèles de la recherche d’information en particulier le modèle booléen, le modèle vectoriel et le modèle probabiliste. Le deuxième point traité dans ce chapitre concerne l’évaluation des systèmes de recherche d’information. Au second chapitre nous décrivons les modèles de langue en linguistique informatique avec l’idée de base et les techniques de lissage et aussi les approches utilisés pour caractériser les documents. Etant le but et de réordonner des documents a l’aide d’un facteur qui est le score de clarté, au troisième et dernier chapitre nous présentons notre approche qui est implémentée en utilisant la plateforme terrier, ainsi que nous présentons les outils de développement et enfin des résultats expérimentaux obtenu sur la collection de test TREC AP88.

Description

59 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Recherche d’information, Modèle booléen, Modèle booléen, Evaluation des SRI

Citation

Ingénieurie Des Systémes D'Information