Extension d’un modèle d’expansion de requêtes pour la prise en compte de la représentation de type word embedding

Loading...
Thumbnail Image

Date

2017

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

Notre travail se situe dans le domaine de la recherche d’information(RI), particulièrement dans l’expansion de la requête qui consiste à ajouter de nouveaux termes à la requête initiale et pour cela nous utilisons la technique word embeddings. Le word embeddings est une technique d’apprentissage qui vise à cartographier des mots à partir d’un vocabulaire en vecteurs de nombres réels dans un espace à faible dimension, cette technique permet du capturer le sens des mots. Les word embedding ont montrés aussi des propriétés d’analogie entre les termes, ils sont obtenus par des modèles tel que word2vect qui se base sur les réseaux de neurones il prend en entrée un grand corpus de texte et produit un espace vectoriel, chaque mot unique dans le corpus étant affecté d’un vecteur correspondant dans l’éspace,les mots qui partagent des contextes communs dans le corpus se trouvent à proximité l’un de l’autre dans l’espace Notre travail consiste à intégrer les représentations distribuées de mots(les word embedding) obtenues par un modèle neuronale (Word2vect) dans les fonctions de modèle d’expansion de requêtes.

Description

62 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Recherche D’Information, Word Embedding, Expansion De Requête

Citation

Systéme Informatique