Wring - Extraire des données présentes sur des pages web, en ligne de commande

http://korben.info/wring-extraire-donnees-presentes-pages-web-ligne-de-commande.html
Si vous cherchez un moyen rapide en ligne de commande (pour vos scripts par exemple), d’extraire de la donnée depuis n’importe quelle page web, il existe un outil baptisé Wring qui sait scrapper du HTML en se reposant sur les styles CSS de la page. Pour que vous compreniez mieux comment ça fonctionne, voici un…

1 « J'aime »

Je viens de tester et c’est pas mal.
Pour scrapper j’utilise PHP Simple HTML DOM Parser qui est un poil overkill mais plus complet. Par exemple pour récup l’id d’un élément c’est plus simple (pas besoin de parser le html une fois la requête effectuée). Le gros avantage de Wring c’est que c’est ça utilise PhantomJS donc possibilité d’exécuter le Javascript.
Merci pour la découverte :slight_smile:

Autrement dit … dès que le code de la page change ton script est cassé ?

Si tu cibles une classe et que le nom de la classe change: oui. Mais, techniquement, seulement les données entre sont susceptibles de changer.