Etude comparative de web scraping : Etude des outils scrapy et Apache-nutch
Loading...
Date
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université Mouloud Mammeri
Abstract
L’objectif de notre travail est d’Acquérir les notions théoriques et pratiques nécessaires à la mise en oeuvre d’un meilleur outil d’acquisition automatisé de données sur le web. Notre projet se concentre particulièrement sur deux outils de web scraping : Scrapy et apach_nutch . Chaque outil fait l’objet d’une présentation théorique et d’exemples pratiques de programmation. Afin de pouvoir les comparer sur tous les aspects et proposer le meilleur outil qui récapitule, regroupe et synthétise les données selon le besoin de chacun de nous.
Description
83 f. : ill. ; 30 cm. (+ CD-Rom)
Keywords
Web scraping, Scrapy, Apach-nutch, Extraction de données, Crawler, Item, Pipeline-item, Spiders, Solr, Indexation
Citation
Systéme Informatique