Blog

Train your brain this new years

scrap google avec zennoposter

Comment scraper Google avec Zennoposter

Si vous êtes tombé sur cet article, c’est que vous connaissez sans doute le logiciel Zennoposter. En effet, vous vous demandez comment scrapper les résultats Google en utilisant Zennoposter ?

Utiliser Parse Data avec Zennoposter pour Scraper les résultats de Google

Dans un premier temps, il vous suffit d’aller sur l’onglet « go to page ». Vous devez donc entrer une url. Prenons dans notre cas l’exemple suivant : https://www.google.com/search?&q=scapping+zennoposter. Petite astuce, si vous souhaitez scraper le top 100 de Google d’un coup avec Zennoposter, vous pouvez utiliser le paramètre &num=100. (https://www.google.com/search?&q=scapping+zennoposter&num=100)

scrap google avec zennoposter

Une fois la page de résultats Google lancée, il vous suffit de faire clic droit sur le lien de l’url (si vous souhaitez scrapper l’URL) ou sur un autre élément (title, meta description, …)et d’utiliser la fonction de Zennoposter : Parse Data. Vous ajouter au projet et sauvegarder dans une liste.

Vous pouvez ensuite faire une boucle en cliquant sur « suivant ». En revanche attention à ne pas scrapper trop fort, sans quoi vous pourriez être blacklisté par Google. C’est pourquoi, l’utilisation de proxy peux être utile. Personnellement, j’achète mes proxies chez instantproxies.com.

Sauvegarder les datas scrappées avec Zennoposter dans un fichier

Une fois les données sauvegardées dans la liste, il vous suffit d’utiliser la fonction « List Processing => Save to file » de Zennoposter.

Vous aurez ainsi la liste des différentes données dans un fichier.txt.

Vous pouvez télécharger le fichier Zennoposter qui permet de scraper le top 100 de google ici :

[button link= »http://ge.tt/2XHjjTw2″ type= »big » newwindow= »yes »] Télécharger le template Zennoposter[/button]

Pour plus d’infos, vous pouvez me contacter par mail ou par skype at joanny.thevenin.

Petit tips Zennoposter supplémentaire :

Avec la fonction Parsing Data dans additional settings et dans Search String vous pouvez opter pour une analyse soit avec le CSS Selector soit lertaitement XPath.
Qu’est-ce que XPath?
Il s’agit d’un langage flexible et puissant pour interroger les éléments de document xml ou (x) html et les transformations DOM xslt, qui est la norme du consortium W3C .
Dans Zennoposter le XPath sert pour l’analyse des sites et pour rechercher des éléments sur une page Web.
À l’aide des constructions de syntaxe XPath, vous pouvez implémenter un algorithme de traitement des données plus universel qui résiste mieux aux modifications de la disposition du site que les expressions régulières.
Ce langage de requête peut considérablement simplifier la logique des analyseurs et ainsi accélérer leur développement.

 

One Response

  1. vincent rogeat
    janvier 30, 2020

Write a Comment