Titre : | Implémentation et expérimentation d’une méthode de propagation des termes en utilisant de différentes formules de pondération | Type de document : | theses et memoires | Auteurs : | Sonia Aimene ; Belhocine Naoual ; Samia Berchiche (ép. Fellag), Directeur de thèse | Editeur : | Tizi Ouzou : UMMTO.FGEI | Année de publication : | 2013 | Importance : | 141p. | Présentation : | ill. | Format : | 24cm. | Note générale : | Bibliog. | Langues : | Français | Mots-clés : | XML XFIRM Recherche d'information Documets structurés formules de pondération INEX. | Résumé : | La nature de sources d’information évolue, et les documents numériques
traditionnels plats ” ne contenant que du texte s’enrichissent d’information structurelle et
multimédia.
Cee ìévoluon est accélérée par l’expansion du Web, et les documents semistructurés
de type XML (eXtensible Markup Language) tendent à former la majorité des
documents numériques mis disposition des utilisateurs. Le développement d’outils
automatisés permettant un accès efficace à ce nouveau type d’information numérique
apparaît comme une nécessité. Afin de valoriser au mieux l’ensemble des informations
disponibles, les méthodes existantes de Recherche d’Information (RI) doivent être adaptées.
L’information structurelle des documents peut en effet servir à affiner le concept de granule
documentaire. Le but pour les Systèmes de Recherche d’Information (SRI) est alors de
retrouver des unités d’information (et non plus de documents) pertinentes à des requêtes
utilisateur. Afin de répondre à cette problématique fondamentale, de nouveaux modèles
prenant en compte l’information structurelle des documents, tant au niveau de l’indexation,
de l’interrogation que de la recherche doivent être construits.
L’objectif de nos travaux est d’implémenter une methode permettant d’effectuer des
recherches dans des corpus de document semi-structurés. Ceci nous a conduits à concevoir
un modèle de recherche d'information dans les documents semi-structurés. Ce modèle a
pour but de trouver les unités d’information les plus exhaustives, spécifiques et plus
informatif répondant à une requête utilisateur. Les documents semi-structurés peuvent être
représentés sous forme arborescente, et le but est alors de trouver les sous-arbres de taille
minimale, qui représenterait au mieux le document XML. Pour ce faire, Le modèle
implémente une méthode de propagation des termes et de leur poids dans l'arbre en
utilisant des formules de pondération.
L'évaluation de ce modèle montre l'intérêt de la méthode implémentée, à savoir la
méthode de propagation des termes et les résultats des tests des formules de pondération
utilisées. | En ligne : | D:\CD.TH.2013\MAST.2013\FELLAG.SAMIA.PDF | Format de la ressource électronique : | PDF | Permalink : | ./index.php?lvl=notice_display&id=31202 |
Implémentation et expérimentation d’une méthode de propagation des termes en utilisant de différentes formules de pondération [theses et memoires] / Sonia Aimene ; Belhocine Naoual ; Samia Berchiche (ép. Fellag), Directeur de thèse . - Tizi Ouzou (Tizi Ouzou) : UMMTO.FGEI, 2013 . - 141p. : ill. ; 24cm. Bibliog. Langues : Français Mots-clés : | XML XFIRM Recherche d'information Documets structurés formules de pondération INEX. | Résumé : | La nature de sources d’information évolue, et les documents numériques
traditionnels plats ” ne contenant que du texte s’enrichissent d’information structurelle et
multimédia.
Cee ìévoluon est accélérée par l’expansion du Web, et les documents semistructurés
de type XML (eXtensible Markup Language) tendent à former la majorité des
documents numériques mis disposition des utilisateurs. Le développement d’outils
automatisés permettant un accès efficace à ce nouveau type d’information numérique
apparaît comme une nécessité. Afin de valoriser au mieux l’ensemble des informations
disponibles, les méthodes existantes de Recherche d’Information (RI) doivent être adaptées.
L’information structurelle des documents peut en effet servir à affiner le concept de granule
documentaire. Le but pour les Systèmes de Recherche d’Information (SRI) est alors de
retrouver des unités d’information (et non plus de documents) pertinentes à des requêtes
utilisateur. Afin de répondre à cette problématique fondamentale, de nouveaux modèles
prenant en compte l’information structurelle des documents, tant au niveau de l’indexation,
de l’interrogation que de la recherche doivent être construits.
L’objectif de nos travaux est d’implémenter une methode permettant d’effectuer des
recherches dans des corpus de document semi-structurés. Ceci nous a conduits à concevoir
un modèle de recherche d'information dans les documents semi-structurés. Ce modèle a
pour but de trouver les unités d’information les plus exhaustives, spécifiques et plus
informatif répondant à une requête utilisateur. Les documents semi-structurés peuvent être
représentés sous forme arborescente, et le but est alors de trouver les sous-arbres de taille
minimale, qui représenterait au mieux le document XML. Pour ce faire, Le modèle
implémente une méthode de propagation des termes et de leur poids dans l'arbre en
utilisant des formules de pondération.
L'évaluation de ce modèle montre l'intérêt de la méthode implémentée, à savoir la
méthode de propagation des termes et les résultats des tests des formules de pondération
utilisées. | En ligne : | D:\CD.TH.2013\MAST.2013\FELLAG.SAMIA.PDF | Format de la ressource électronique : | PDF | Permalink : | ./index.php?lvl=notice_display&id=31202 |
|