Etude comparative de web scraping : Etude des outils scrapy et Apache-nutch

Loading...
Thumbnail Image

Date

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Université Mouloud Mammeri

Abstract

L’objectif de notre travail est d’Acquérir les notions théoriques et pratiques nécessaires à la mise en oeuvre d’un meilleur outil d’acquisition automatisé de données sur le web. Notre projet se concentre particulièrement sur deux outils de web scraping : Scrapy et apach_nutch . Chaque outil fait l’objet d’une présentation théorique et d’exemples pratiques de programmation. Afin de pouvoir les comparer sur tous les aspects et proposer le meilleur outil qui récapitule, regroupe et synthétise les données selon le besoin de chacun de nous.

Description

83 f. : ill. ; 30 cm. (+ CD-Rom)

Keywords

Web scraping, Scrapy, Apach-nutch, Extraction de données, Crawler, Item, Pipeline-item, Spiders, Solr, Indexation

Citation

Systéme Informatique