Récupérer des adresses emails via les moteurs de recherche

http://korben.info/recuperer-adresses-emails-via-moteurs-de-recherche.html
Email Harvester est un script python plutôt cool puisqu’il permet de récupérer toutes les adresses emails en @machinchose.com (à remplacer par le domaine de votre choix) qui trainent publiquement sur le net et qui sont donc trouvables via les moteurs de recherche. Pour installer ce script, ouvrez un terminal et clonez le repo Git :…

Dans le même principe, Il existe theharvester :
theharvester -d korben.com -l 500 -b all

Il permet de trouver emails, hostnames, virtual hosts.

Ce qui serait bien c’est qu’il indique pour chaque adresse email, la source de sa trouvaille. (De sorte à ce que les entreprises puissent faire le nettoyage pour éviter de se faire phisher/spammer). Possible ?

Excellent ! Petite coquille dans l’installation : il faut un double tiret dans :
pip install -r requirements.txt --user

Bonjour à tous, je me casse la tête pour l’installer depuis 1h :

  • 1ère difficulté : installer une version fonctionnelle de pip sur Ubuntu 15.10. La solution que j’ai trouvée : sudo easy_install pip après avoir purgé les éventuelles installations précédentes par sudo apt-get remove --purge python-pip

  • 2nde difficulté : en lançant le script, j’ai l’erreur suivante : ImportError: No module named 'termcolor'. Pourtant, termcolor est bien installé (la commande pip install termcolor renvoit : `Requirement already satisfied (use --upgrade to upgrade): termcolor in ./.local/lib/python2.7/site-packages``. Et là, je suis bloqué :frowning:

Est-ce que quelqu’un a une idée ? Merci d’avance !

Existe-t-il une solution pour mettre son adresse mail sur son site sans subir toutes les conséquences qui en découlent?

Tu mets ton adresse ou une partie (par ex le @) en image. Les robots ne peuvent ainsi pas la récupérer.
Si la page est non indéxée par les moteurs de recherche (ex page post-authentification), tu es aussi tranquille, même si c’est en texte.

Comme dit précédemment ton adresse dans une image ou bien chargée en Ajax, je crois que c’est ce qu’utilisait leboncoin pour l’affichage des numéros de téléphone de ses annonces

Ah oui pas con… Merci.

J’ai bien tout suivi mais ça me met une erreur : ImportError : No module named 'requests’
J’vois pas d’où ça peut venir…

pip install --user requests

La bonne commande a saisir est:

pip install -r requirements.txt --user

et non

pip install -r requirements.txt –user

Alors après pas mal d’essais, le problème vient de l’utilisation de Python 3, alors qu’Ubuntu utilise Pyhton 2 par défaut. Il faut donc installer pip pour Python 3 :
sudo apt-get install python3-pip

puis installer les dépendances avec Python 3 également :
sudo pip3 install -r requirements.txt --user

Si ça ne marche toujours pas, il faut forcer Ubuntu à utiliser Python 3, en modifiant l’alias pour l’utilisateur local :
sudo nano ~/.bash_aliases

Ajouter la ligne :
alias python=python3

Puis redémarrer le terminal

En tout cas, ça marche chez moi maintenant, j’espère que ça pourra en aider certains…

Bonjoir,

Sinon il y aussi Email-Hunter (l’extension chrome) pour les flemmards comme moi.

Très intéressant!

Tout d’abord pour ceux comme moi qui n’arrivaient pas a ajouter les modules requis il faut installer la dernière version de python -> https://openclassrooms.com/courses/apprenez-a-programmer-en-python/qu-est-ce-que-python

Puis une fois que c’est fait vous dever utiliser pip mais avec python3.5 (dans mon cas) :

python3.5 -m pip install -r requirements.txt --user

Voila ça marche normalement.

Par contre j’ai fait quelques tests, je doute un peu de l’exhaustivité des résultats, en effet le script fait une recherche que sur les 100 premiers résultats (ce qui est déjà pas mal). Mais du coup ça ne donne qu’un aperçu de toutes les adresses qui traînent au fin fond du web.

Je reviens sur ce que j’ai dit puisqu’on peut augmenter la limite de 100 avec l’argument -l donc pour 1000 ajouter -l 1000 et on a déjà plus de résultats, par contre c’est plus long.

Exemple pour “gmail.com” -> 78 résultats

Pour Email-Hunter j’ai testé, c’est encore mieux on a l’adresse de la page ou l’adresse email est présente. C’est pas mal si on veut faire des corrections des personnes parties à la retraites par exemple.

Mais pareil il manque des adresses.

Je confirme, j’ai un peu galeré aussi.

Même solution que toi à part pour le sudo apt-get install python3-pip ou j’ai fais un python3.4 get-pip.py puis pip3.4 install -r requirements.txt --user