Implémentation et évaluation d’une méthode de sélection de termes d’expansion basée sur les caractéristiques de la requête.

Loading...
Thumbnail Image

Date

2016

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

L’objectif fondamentale de la RI consiste à mettre en oeuvre un mécanisme d’appariement entre une requête utilisateur et les documents d’une base documentaire, afin de restituer l’information pertinente, l’accès à l’information peut être effectué à travers d’un système de Recherche d’information (SRI). Les systèmes de recherche d’information (SRI) ont dû s'adapter à cette révolution technique pour devenir des systèmes capables de gérer des collections de documents. Le SRI compare la représentation de cette requête à la représentation de chaque document. Cette comparaison est réalisée au moyen d’une fonction de correspondance (Retrieval StatusValue : RSV) et un score de pertinence est affecté à chaque document. Ces scores permettent de présenter à l’utilisateur les documents pertinents ordonnés. Les modèles de recherche et représentation d’information sont basés sur le processus de mise en correspondance entre la requête utilisateur et documents de la collection Dans le processus d’indexation, l’ensemble des descripteurs ou mots clés représentent des documents, ce qu’on appelle une présentation par le sac des mots. Plusieurs méthodes en développements, parmi où on trouve celle prenant en compte la proximité entre les termes (des termes adjacents) et utilisation d’unité de présentation plus complexe (N-grammes). Notre approche dans ce mémoire s’inscrit dans les travaux qui améliorent la performance de recherche d’information, nous étudions l’expansion de la requête automatique qui permet de reformulé la requête de l’utilisateur pour remédie le problème de sélection des documents pertinents, puis sur la base de ces derniers, sélection des termes d’expansion comme unité d’indexe dans le modèle de langue (probabiliste), puis nous avons analysé les caractéristique de la requête à savoir la taille et la clarté de celle-ci.si la requête est clair le SRI retourne les résultats pertinents vis- à-vis de la requête initiale formulée par l’utilisateur sinon il retourne des documents non pertinents cela veut dire que la requête est ambiguë. Dans ce cadre s’inscrit notre approche. Pour remédier à ce problème nous avons utilisé la diversification des documents en utilisant K-Means qui permit de traité les requêtes multithématiques. Nous avons expérimenté et évalué notre approche proposée sur la plateforme terrier1.2 avec l’implémentation du modèle de langue (probabiliste) et le modèle TF-IDF pour la recherche simple et l’expansion, la collection de test TRC et les requêtes (Topic101-150). Le but d’un système de recherche d’information est donc de renvoyer l’information pertinente vis-à-vis du besoin en information de l’utilisateur.

Description

94 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

K-means, Terrier, Réquéte, Recherche d'information, SRI

Citation

Systéme Informatique