|
| Titre : | Implémentation et évaluation d'une méthode de réordonnancement de documents se basant sur la clarté du document.. | | Type de document : | theses et memoires | | Auteurs : | Aghilas Haddouche ; Faredj Hammache ; Arezki Hammache, Directeur de thèse | | Editeur : | Tizi Ouzou : UMMTO.FGEI | | Année de publication : | 2014 | | Importance : | p. | | Présentation : | ill. | | Format : | 29 cm. | | Note générale : | Bibliogr. | | Langues : | Français | | Résumé : | L’objectif fondamental de la RI consiste à mettre en oeuvre un mécanisme
d’appariement entre requête utilisateur et documents d’une base afin de restituer
l’information pertinente, l’accès à l’information peut être effectué a travers un système de
recherche d’information (SRI).
L’objectif d’un SRI est d’aiguiller la recherche dans le fond documentaire, en direction
de l’information pertinente relativement à un besoin en information exprimé par une requête
utilisateur.
Cependant dans la majorité des SRI, uniquement le contenu textuel est utilisé pour
établir la correspondance entre les documents et les requetés. D'autres caractéristiques
indépendantes de la requêtes peuvent être utilisé pour l'ordonnancement a priori des
documents, tel que le pagerank dans le web etc.
C'est dans ce contexte que s'insère notre travail; plus précisément à exploiter la
caractéristique de la clarté du document vis-à -vis de la collection en supposant qu'un
document claire est a priori pertinent.
L’organisation retenue pour la présentation de notre travail s’articule en trois
chapitres. Dans le chapitre 1 nous décrivons deux points essentiels. Tout d’abord, nous
donnons les concepts de base de la recherche d’information. On y trouve les notions de
requête, de document, de collection et de pertinence et le processus d’indexation. Nous
décrivons aussi les différents modèles de la recherche d’information en particulier le
modèle booléen, le modèle vectoriel et le modèle probabiliste. Le deuxième point traité
dans ce chapitre concerne l’évaluation des systèmes de recherche d’information. Au second
chapitre nous décrivons les modèles de langue en linguistique informatique avec l’idée de
base et les techniques de lissage et aussi les approches utilisés pour caractériser les
documents. Etant le but et de réordonner des documents a l’aide d’un facteur qui est le score
de clarté, au troisième et dernier chapitre nous présentons notre approche qui est
implémentée en utilisant la plateforme terrier, ainsi que nous présentons les outils de
développement et enfin des résultats expérimentaux obtenu sur la collection de test TREC
AP88. | | En ligne : | D:\CD.INF. 2014\MASTER 2014\HAMMACHE F, HADDOUCHE A..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31051 |
Implémentation et évaluation d'une méthode de réordonnancement de documents se basant sur la clarté du document.. [theses et memoires] / Aghilas Haddouche ; Faredj Hammache ; Arezki Hammache, Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2014 . - p. : ill. ; 29 cm. Bibliogr. Langues : Français | Résumé : | L’objectif fondamental de la RI consiste à mettre en oeuvre un mécanisme
d’appariement entre requête utilisateur et documents d’une base afin de restituer
l’information pertinente, l’accès à l’information peut être effectué a travers un système de
recherche d’information (SRI).
L’objectif d’un SRI est d’aiguiller la recherche dans le fond documentaire, en direction
de l’information pertinente relativement à un besoin en information exprimé par une requête
utilisateur.
Cependant dans la majorité des SRI, uniquement le contenu textuel est utilisé pour
établir la correspondance entre les documents et les requetés. D'autres caractéristiques
indépendantes de la requêtes peuvent être utilisé pour l'ordonnancement a priori des
documents, tel que le pagerank dans le web etc.
C'est dans ce contexte que s'insère notre travail; plus précisément à exploiter la
caractéristique de la clarté du document vis-à -vis de la collection en supposant qu'un
document claire est a priori pertinent.
L’organisation retenue pour la présentation de notre travail s’articule en trois
chapitres. Dans le chapitre 1 nous décrivons deux points essentiels. Tout d’abord, nous
donnons les concepts de base de la recherche d’information. On y trouve les notions de
requête, de document, de collection et de pertinence et le processus d’indexation. Nous
décrivons aussi les différents modèles de la recherche d’information en particulier le
modèle booléen, le modèle vectoriel et le modèle probabiliste. Le deuxième point traité
dans ce chapitre concerne l’évaluation des systèmes de recherche d’information. Au second
chapitre nous décrivons les modèles de langue en linguistique informatique avec l’idée de
base et les techniques de lissage et aussi les approches utilisés pour caractériser les
documents. Etant le but et de réordonner des documents a l’aide d’un facteur qui est le score
de clarté, au troisième et dernier chapitre nous présentons notre approche qui est
implémentée en utilisant la plateforme terrier, ainsi que nous présentons les outils de
développement et enfin des résultats expérimentaux obtenu sur la collection de test TREC
AP88. | | En ligne : | D:\CD.INF. 2014\MASTER 2014\HAMMACHE F, HADDOUCHE A..PDF | | Format de la ressource électronique : | PDF | | Permalink : | ./index.php?lvl=notice_display&id=31051 |
|