Implémentation et évaluation d’un modèle de langue pour la Recherche d’Information dans les documents XML

Loading...
Thumbnail Image

Date

2016

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

Notre travail consistait aux tests et à l’évaluation du modèle de langue présenté dans [Belkacem, 2015] , ce modèle de langue adapté aux documents XML estime le score de pertinence des éléments d’un document en prenant en compte la taille d’éléments en nombre termes, et le nombre de noeuds feuille ainsi que la taille moyenne d’un élément dans ce document. Afin de répondre à une requête utilisateur en lui fournissant un élément ou un ensemble d’élément comme résultat, nous avons estimé la probabilité de similarité (élément- requête) qui revient à calculer la probabilité d’avoir un élément comme résultat qui peut être calculer soit par la formule de base [3.1] (qui a été déjà testé et évalué par l’auteur avec la probabilité de vraisemblance [5.1], soit par la formule variante [3.2] (que nous avons testé, avec la formule de vraisemblance [5.2]), et cela, en commençant par le calcul de la probabilité d’importance d’un terme de la requête dans un élément, ensuite appliqué le produit de ces probabilités pour tous les termes de la requête ( c’est la distribution aux termes de la requête), et enfin le produit entre la valeur de similarité et le produit associée à l’élément, ce qui nous donne le score de pertinence d’un élément pour une requête utilisateur. Après avoir implémenté et testé l’approche proposée dans [Belkacem,2015],nous avons effectué une comparaison entre les résultats des scores obtenus par les formulesde tests dans [Belkacem,2015] et les résultats de tests obtenus par les formules considérés dans notre travail en utilisant la mesure du gain que nous avons calculée sur les 5 rangs (5,10,25,50,max). Nous avons remarqué que les résultats de nos tests ont abouti à un gain de +6% sur la totalité des résultats et jusqu'à +17% sur les 50 premier résultats. Enfin nous concluons qu’avec le modèle de langue implémenté nous avons obtenus des résultats satisfaisants, grâce à la prise en compte des caractéristiques des documents XML comme paramètres dans les formules de calcul des scores.

Description

69 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

XML, ARBRE, Elément, Modéle de langue

Citation

Conduite De Projets Informatiques