Expansion de requêtes de l’utilisateur à base des termes composés

Loading...
Thumbnail Image

Date

2012

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

La recherche d'information (RI) est un vaste domaine d'étude apparu dans les années 60. L'avènement d'Internet et plus particulièrement du Web a conduit à révéler la RI au grand jour, notamment par le biais des moteurs de recherche. La profusion de données numériques disponibles a rendu indispensables des moyens de recherche performants et automatiques, permettant à tout un chacun de trouver une information précise. La RI a alors évolué vers des tâches de plus en plus nombreuses et diversifiées. Les systèmes de RI, quels que soient leurs objectifs, la nature ou la provenance de l'information manipulée, tendent en fait vers le même but : établir une correspondance entre l'information disponible et celle recherchée par l'utilisateur. L’un des problèmes-clés des systèmes de recherche d’informations (SRI) est la définition d’une fonction de correspondance entre la représentation du contenu sémantique des documents et la requête de l’utilisateur. Cette fonction doit modéliser la pertinence d’un document pour l’utilisateur. De fait, il existe deux formes de pertinence : la pertinence système et la pertinence utilisateur. Améliorer la qualité d’un système de recherche d’information (SRI) consiste donc à réduire la distance existant entre la pertinence utilisateur et la pertinence système. La stratégie traditionnelle consiste à représenter la requête et le document par un vecteur selon les termes observés, et à mesurer la similarité entre eux. La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues dans lesquelles ces contenus sont disponibles. Des traitements spécifiques s'avèrent donc nécessaires pour préciser le sens de certaines requêtes, ou au contraire pour en élargir la portée, l'Expansion de Requêtes (ER), par exemple, permet, en ajoutant des mots aux requêtes afin d'optimiser leur mise en relation avec les documents. La première approche suivie pour améliorer les performances des systèmes a été la reformulation de la requête qu’est une phase importante dans les systèmes de recherche d’information. Elle se base sur le principe que l’utilisateur n’est souvent pas capable de formuler ses besoins en informations et consiste à récrire la requête de l’utilisateur selon les informations retrouvées par la requête initiale. De manière générale, ceci consiste, dans le cas notamment de la réinjection de la pertinence, d’extraire à partir des premiers documents retournés par le système, les mots clés importants puis les rajouter à la requête initiale. L’objectif de ce projet est de proposer une approche d’expansion de requête d’utilisateur à base des termes composés qui se fonde sur l'hypothèse qu'un mot composé est moins ambigu qu'un mot isolé.

Description

117 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Expansion, Termes composés

Citation

Systéme Informatique