Calcul de Similarité entre annotations conceptuelles

Loading...
Thumbnail Image

Date

2016

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

Avec l’augmentation rapide du volume d’information stocké sous format numérique, et l'avènement du Web, la quantité d'informations disponible ne cesse de croître au cours de ces dernières années, il est devenu alors très difficile de trouver une information ou un document qui répond à un besoin de l’utilisateur. Jusqu'ici on dispose d'un grand volume d'information, mais sans aucune maîtrise de contenu, le résultat est que l'utilisateur perd beaucoup de son temps à examiner un grand nombre de document en cherchant ce qui lui convient, Il a fallu donc envisager le développement des outils automatiques qui permettent de conserver, chercher et classer ces informations, et d’assurer une utilisation ciblé et efficaces de ces données. Notre travail traite l’utilisation des mesures de similarité sémantique pour exprimer la ressemblance entre les documents textuelle. Nous avons décomposer notre mémoire en quatre chapitres. Le premier chapitre vise à définir le processus d’indexation avec ces différents étapes et le langage utilisé qui mène au calcul de la similarité, on présentera aussi l’algorithme de porter, qui est utilisé pour la normalisation des mots. Ainsi, les modèles de représentation des documents textuels. Nous enchainerons dans le deuxième chapitre le problème général de l’indexation classique, et on introduira comme solution l’indexation sémantique basé sur le sens des mots, et pour trouver le sens correcte de mots différentes approches de désambiguïsation sont exploités, basées sur l’utilisation des ressources lexicales et sémantiques. Le troisième chapitre présente l’utilisation de la similarité dans les différents domaines : la recherche d’information, la détection plagiat et dans le domaine de classification des documents .ainsi, les approches utiliser pour mesurer la similarité, qui est notre objectif principal de notre travail. Enfin, le dernier chapitre expose la description des approches implémentées ainsi que les résultats obtenus.

Description

60 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Indexation sémantique, Thésaurus, Methodes Hybrides, Wordnet2, 1, JWNL

Citation

Conduite De Projets Informatiques