|
| Titre : | Expansion de requêtes de l’utilisateur à base des termes composés | | Type de document : | theses et memoires | | Auteurs : | Karima Arhab ; Guezoui Faroudja ; Arezki Hammache, Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2012 | | Importance : | 117 p. | | Présentation : | ill. | | Format : | 30 cm | | Note générale : | Bibliogr. | | Langues : | Français | | Mots-clés : | Expansion Termes composés | | Résumé : | La recherche d'information (RI) est un vaste domaine d'étude apparu dans les années 60.
L'avènement d'Internet et plus particulièrement du Web a conduit à révéler la RI au grand
jour, notamment par le biais des moteurs de recherche. La profusion de données numériques
disponibles a rendu indispensables des moyens de recherche performants et automatiques,
permettant à tout un chacun de trouver une information précise. La RI a alors évolué vers des
tâches de plus en plus nombreuses et diversifiées.
Les systèmes de RI, quels que soient leurs objectifs, la nature ou la provenance de
l'information manipulée, tendent en fait vers le même but : établir une correspondance entre
l'information disponible et celle recherchée par l'utilisateur. L’un des problèmes-clés des
systèmes de recherche d’informations (SRI) est la définition d’une fonction de
correspondance entre la représentation du contenu sémantique des documents et la requête de
l’utilisateur. Cette fonction doit modéliser la pertinence d’un document pour l’utilisateur. De
fait, il existe deux formes de pertinence : la pertinence système et la pertinence utilisateur.
Améliorer la qualité d’un système de recherche d’information (SRI) consiste donc à réduire la
distance existant entre la pertinence utilisateur et la pertinence système. La stratégie
traditionnelle consiste à représenter la requête et le document par un vecteur selon les termes
observés, et à mesurer la similarité entre eux.
La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues
dans lesquelles ces contenus sont disponibles. Des traitements spécifiques s'avèrent donc
nécessaires pour préciser le sens de certaines requêtes, ou au contraire pour en élargir la
portée, l'Expansion de Requêtes (ER), par exemple, permet, en ajoutant des mots aux requêtes
afin d'optimiser leur mise en relation avec les documents. La première approche suivie pour
améliorer les performances des systèmes a été la reformulation de la requête qu’est une phase
importante dans les systèmes de recherche d’information. Elle se base sur le principe que
l’utilisateur n’est souvent pas capable de formuler ses besoins en informations et consiste Ã
récrire la requête de l’utilisateur selon les informations retrouvées par la requête initiale. De
manière générale, ceci consiste, dans le cas notamment de la réinjection de la pertinence,
d’extraire à partir des premiers documents retournés par le système, les mots clés importants
puis les rajouter à la requête initiale.
L’objectif de ce projet est de proposer une approche d’expansion de requête d’utilisateur Ã
base des termes composés qui se fonde sur l'hypothèse qu'un mot composé est moins ambigu
qu'un mot isolé. | | En ligne : | D:\CD.TH.2012\MAST2012\ARHAB.KARIMA-GUEZOUI.FAROUDJA.PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31098 |
Expansion de requêtes de l’utilisateur à base des termes composés [theses et memoires] / Karima Arhab ; Guezoui Faroudja ; Arezki Hammache, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2012 . - 117 p. : ill. ; 30 cm. Bibliogr. Langues : Français | Mots-clés : | Expansion Termes composés | | Résumé : | La recherche d'information (RI) est un vaste domaine d'étude apparu dans les années 60.
L'avènement d'Internet et plus particulièrement du Web a conduit à révéler la RI au grand
jour, notamment par le biais des moteurs de recherche. La profusion de données numériques
disponibles a rendu indispensables des moyens de recherche performants et automatiques,
permettant à tout un chacun de trouver une information précise. La RI a alors évolué vers des
tâches de plus en plus nombreuses et diversifiées.
Les systèmes de RI, quels que soient leurs objectifs, la nature ou la provenance de
l'information manipulée, tendent en fait vers le même but : établir une correspondance entre
l'information disponible et celle recherchée par l'utilisateur. L’un des problèmes-clés des
systèmes de recherche d’informations (SRI) est la définition d’une fonction de
correspondance entre la représentation du contenu sémantique des documents et la requête de
l’utilisateur. Cette fonction doit modéliser la pertinence d’un document pour l’utilisateur. De
fait, il existe deux formes de pertinence : la pertinence système et la pertinence utilisateur.
Améliorer la qualité d’un système de recherche d’information (SRI) consiste donc à réduire la
distance existant entre la pertinence utilisateur et la pertinence système. La stratégie
traditionnelle consiste à représenter la requête et le document par un vecteur selon les termes
observés, et à mesurer la similarité entre eux.
La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues
dans lesquelles ces contenus sont disponibles. Des traitements spécifiques s'avèrent donc
nécessaires pour préciser le sens de certaines requêtes, ou au contraire pour en élargir la
portée, l'Expansion de Requêtes (ER), par exemple, permet, en ajoutant des mots aux requêtes
afin d'optimiser leur mise en relation avec les documents. La première approche suivie pour
améliorer les performances des systèmes a été la reformulation de la requête qu’est une phase
importante dans les systèmes de recherche d’information. Elle se base sur le principe que
l’utilisateur n’est souvent pas capable de formuler ses besoins en informations et consiste Ã
récrire la requête de l’utilisateur selon les informations retrouvées par la requête initiale. De
manière générale, ceci consiste, dans le cas notamment de la réinjection de la pertinence,
d’extraire à partir des premiers documents retournés par le système, les mots clés importants
puis les rajouter à la requête initiale.
L’objectif de ce projet est de proposer une approche d’expansion de requête d’utilisateur Ã
base des termes composés qui se fonde sur l'hypothèse qu'un mot composé est moins ambigu
qu'un mot isolé. | | En ligne : | D:\CD.TH.2012\MAST2012\ARHAB.KARIMA-GUEZOUI.FAROUDJA.PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31098 |
|