|
| Titre : | Implémentation et évaluation d’une méthode de sélection de termes d’expansion basée sur les caractéristiques de la requête. | | Type de document : | theses et memoires | | Auteurs : | KAMILIA BELLABIOD, Auteur ; Lallouche Dehbia, Auteur ; Arezki Hammache, Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2016 | | Importance : | 94p. | | Présentation : | ill. | | Format : | 30 cm. | | Note générale : | Bibliogr. | | Langues : | Français | | Mots-clés : | K-means Terrier Réquéte Recherche d'information SRI. | | Résumé : | Résumé
L’objectif fondamentale de la RI consiste à mettre en oeuvre un mécanisme d’appariement entre une
requête utilisateur et les documents d’une base documentaire, afin de restituer l’information pertinente, l’accès Ã
l’information peut être effectué à travers d’un système de Recherche d’information (SRI).
Les systèmes de recherche d’information (SRI) ont dû s'adapter à cette révolution technique pour devenir
des systèmes capables de gérer des collections de documents.
Le SRI compare la représentation de cette requête à la représentation de chaque document. Cette
comparaison est réalisée au moyen d’une fonction de correspondance (Retrieval StatusValue : RSV) et un score
de pertinence est affecté à chaque document. Ces scores permettent de présenter à l’utilisateur les documents
pertinents ordonnés.
Les modèles de recherche et représentation d’information sont basés sur le processus de mise en
correspondance entre la requête utilisateur et documents de la collection
Dans le processus d’indexation, l’ensemble des descripteurs ou mots clés représentent des documents, ce
qu’on appelle une présentation par le sac des mots. Plusieurs méthodes en développements, parmi où on trouve
celle prenant en compte la proximité entre les termes (des termes adjacents) et utilisation d’unité de présentation
plus complexe (N-grammes).
Notre approche dans ce mémoire s’inscrit dans les travaux qui améliorent la performance de recherche
d’information, nous étudions l’expansion de la requête automatique qui permet de reformulé la requête de
l’utilisateur pour remédie le problème de sélection des documents pertinents, puis sur la base de ces derniers,
sélection des termes d’expansion comme unité d’indexe dans le modèle de langue (probabiliste), puis nous avons
analysé les caractéristique de la requête à savoir la taille et la clarté de celle-ci.si la requête est clair le SRI retourne
les résultats pertinents vis- à -vis de la requête initiale formulée par l’utilisateur sinon il retourne des documents
non pertinents cela veut dire que la requête est ambiguë. Dans ce cadre s’inscrit notre approche. Pour remédier Ã
ce problème nous avons utilisé la diversification des documents en utilisant K-Means qui permit de traité les
requêtes multithématiques.
Nous avons expérimenté et évalué notre approche proposée sur la plateforme terrier1.2 avec
l’implémentation du modèle de langue (probabiliste) et le modèle TF-IDF pour la recherche simple et l’expansion,
la collection de test TRC et les requêtes (Topic101-150).
Le but d’un système de recherche d’information est donc de renvoyer l’information pertinente vis-à -vis du
besoin en information de l’utilisateur. | | En ligne : | https://dl.ummto.dz/bitstream/handle/ummto/12911/BellabiodKamilia.pdf?sequence=1 [...] | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=30941 |
Implémentation et évaluation d’une méthode de sélection de termes d’expansion basée sur les caractéristiques de la requête. [theses et memoires] / KAMILIA BELLABIOD, Auteur ; Lallouche Dehbia, Auteur ; Arezki Hammache, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2016 . - 94p. : ill. ; 30 cm. Bibliogr. Langues : Français | Mots-clés : | K-means Terrier Réquéte Recherche d'information SRI. | | Résumé : | Résumé
L’objectif fondamentale de la RI consiste à mettre en oeuvre un mécanisme d’appariement entre une
requête utilisateur et les documents d’une base documentaire, afin de restituer l’information pertinente, l’accès Ã
l’information peut être effectué à travers d’un système de Recherche d’information (SRI).
Les systèmes de recherche d’information (SRI) ont dû s'adapter à cette révolution technique pour devenir
des systèmes capables de gérer des collections de documents.
Le SRI compare la représentation de cette requête à la représentation de chaque document. Cette
comparaison est réalisée au moyen d’une fonction de correspondance (Retrieval StatusValue : RSV) et un score
de pertinence est affecté à chaque document. Ces scores permettent de présenter à l’utilisateur les documents
pertinents ordonnés.
Les modèles de recherche et représentation d’information sont basés sur le processus de mise en
correspondance entre la requête utilisateur et documents de la collection
Dans le processus d’indexation, l’ensemble des descripteurs ou mots clés représentent des documents, ce
qu’on appelle une présentation par le sac des mots. Plusieurs méthodes en développements, parmi où on trouve
celle prenant en compte la proximité entre les termes (des termes adjacents) et utilisation d’unité de présentation
plus complexe (N-grammes).
Notre approche dans ce mémoire s’inscrit dans les travaux qui améliorent la performance de recherche
d’information, nous étudions l’expansion de la requête automatique qui permet de reformulé la requête de
l’utilisateur pour remédie le problème de sélection des documents pertinents, puis sur la base de ces derniers,
sélection des termes d’expansion comme unité d’indexe dans le modèle de langue (probabiliste), puis nous avons
analysé les caractéristique de la requête à savoir la taille et la clarté de celle-ci.si la requête est clair le SRI retourne
les résultats pertinents vis- à -vis de la requête initiale formulée par l’utilisateur sinon il retourne des documents
non pertinents cela veut dire que la requête est ambiguë. Dans ce cadre s’inscrit notre approche. Pour remédier Ã
ce problème nous avons utilisé la diversification des documents en utilisant K-Means qui permit de traité les
requêtes multithématiques.
Nous avons expérimenté et évalué notre approche proposée sur la plateforme terrier1.2 avec
l’implémentation du modèle de langue (probabiliste) et le modèle TF-IDF pour la recherche simple et l’expansion,
la collection de test TRC et les requêtes (Topic101-150).
Le but d’un système de recherche d’information est donc de renvoyer l’information pertinente vis-à -vis du
besoin en information de l’utilisateur. | | En ligne : | https://dl.ummto.dz/bitstream/handle/ummto/12911/BellabiodKamilia.pdf?sequence=1 [...] | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=30941 |
|