Proposition et évaluation d'une mesure de similarité sémantique entre concepts MeSH

Loading...
Thumbnail Image

Date

2013

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

La recherche d’information dans le domaine biomédical est particulièrement importante. C’est quotidiennement que les scientifiques et professionnels de santé peuvent avoir besoin de s’appuyer sur des publications médicales. Par conséquent, Il existe de grandes bases de données de documents biomédicaux, à titre d’exemple MEDLINE est la banque de données de référence dans le domaine, elle est accessible principalement par l’interface de PubMed qui est un moteur de recherche spécialisé. Pour faciliter l’accès à l’information biomédicale, plusieurs terminologies ont été développées pour une indexation contrôlée parmi lesquelles, le thésaurus MeSH qui constitue le vocabulaire biomédical normalisé de référence, et le système de langage médical unifié UMLS qui regroupe plus de 150 terminologies du domaine. En pratique les documents de la base MEDLINE sont indexés par des termes issus du thésaurus MeSH. En recherche d’information biomédicale, il est souvent intéressant de retrouver les concepts recherchés mais aussi les concepts qui leurs sont sémantiquement proches (liés). One manière de retrouver ces concepts est à travers la similarité (proximité) sémantique entre eux. La proximité sémantique (ou similarité sémantique) entre concepts est évaluée à travers l’utilisation de mesures de similarité sémantique. Plusieurs mesures ont été proposées dans la littérature : les mesures à base du comptage d’arcs, les mesures basées sur le contenu informatif, les mesures à base des propriétés des concepts et les mesures hybrides. La plupart on été conçues pour évaluer la similarité sémantique entre concepts dans WordNet, une ontologie du domaine général. Peu de mesures ont été développées pour évaluer la similarité entre concepts MeSH. L’objectif de ce mémoire est de proposer, implémenter et évaluer une mesure de similarité sémantique entre concepts MeSH. Pour cela une démarche d’adaptation des mesures existantes pour WordNet est suivie. Notre démarche passe par une monohiérarchisation des domaines de MeSH, qui, à la base est représenté par une multi-hiérarchie. Nous proposons donc, deux approches de mono-hiérarchisation, en utilisant la structure de MeSH uniquement, et en utilisant le réseau sémantique UMLS. Nous proposons ainsi deux mesures de similarité que nous testons avec l’utilisation des deux mono-hiérarchisations proposées.

Description

87 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Recherche d'information, MESH, UMLS

Citation

Conduite De Projets Informatiques