Le crawling consiste à récupérer le contenu d'une page web, alors que le scraping consiste à extraire des informations structurées de ce contenu. Le scraping est donc une étape qui vient après le crawling.
Par exemple, faire une requête sur l'URL d'un article Wikipédia afin de récupérer le code HTML de la page, c'est du crawling. Chercher ensuite dans ce code HTML des informations comme le titre de l'article Wikipédia, c'est du scraping.
Aucun commentaire:
Enregistrer un commentaire