Imacros ou le black hat pour noobs

by 512banque on 25 août 2010

imacros

Pas facile de démarrer dans le BH quand on est un noob en PHP, et qu’on s’y connaît plus en Curly qu’en cURL. On ne sait pas trop par où commencer et on achète des logiciels pourraves, déjà ultra saturés par des centaines de spammers wannabe qui linkent vers les PPP (pilules, poker, porn) et autres cancer rectum. Résultat ? Vous vous retrouvez au milieu de liens nazes qui scient la branche collective sur laquelle tout le monde est assis. Autant jeter son fric par la fenêtre.

Un topic lancé par David sur la sphère m’a permis de me replonger dans un outil pour lequel je n’avais pas trouvé d’intérêt, ou alors un intérêt très vite limité : imacros. A l’époque, j’avais vu le post de Lemoussel sur seoblackout, mais je n’avais pas vraiment compris la réelle valeur ajoutée de cet outil.

Ce topic m’a vraiment permis de me réveiller et de sentir le potentiel de ce tool que je trouve maintenant formidable. Quelques jours plus tard, coïncidence ou pas, le même topic est apparu sur Discodog. Quelques semaines plus tôt, j’avais eu l’occasion d’échanger avec Seoblackout sur l’intérêt de Imacros, et j’ai vu il y a plusieurs mois que Benoît aussi s’y était mis.

Bref, autant dire que je ne suis pas le seul a avoir senti le gros potentiel dans cet outil, et généralement, c’est bon signe.

Tools perso ?

J’en profite pour vous dire confier chose : j’ai toujours été réticent à l’utilisation d’outils où les « spots » sont partagés par d’autres, et donc limités par nature. Il existe bien Senuke, mis à jour 2 fois par semaine, mais qui coûte la bagatelle de 127$/mois.

J’ai toujours préféré la confection d’outils personnalisés ou bien l’utilisation d’outils permettant de trouver ses propres plateformes et d’utiliser ses propres listes. Il faut d’ailleurs que je vous écrive un article sur un outil nouveau et assez sympa que Seoblackout m’a fait découvrir, mais j’attends qu’il rédige son article en premier.

L’automatisation

La clé du BH, comme vous le savez, est l’automatisation. Je crois qu’on est tous à peu près d’accord sur la question. Peu importe que vous lanciez des communiqués de presse, que vous vous inscriviez dans des annuaires ou que vous fassiez du blog farming, si vous automatisez le tout (je pense notamment à l’utilisation du content spinning mais pas que), vous pouvez atteindre des volumes assez monstrueux si vous vous y prenez bien.

La voie royale est évidemment de se constituer ses propres scripts, souvent sous cURL :

  • vous n’êtes tributaire de personne, d’aucune mise à jour,
  • vous pouvez garder secrets (ou presque), vos plans,
  • si vous vous débrouillez bien, vous pouvez réussir à réellement vous construire un empire de lien, en « pluggant » vos tools ensemble,
  • vous avez une très grande rapidité d’exécution des scripts.

Par contre, il y a certains désagréments :

  • nécessité de maîtriser le cURL,
  • relative lenteur de conception du script, donc utilisation de plateformes en nombre limité,
  • vous vous coupez de tout ce qui utilise le javascript en antispam,
  • vous arrivez difficilement à passer les captchas pour lesquels l’url est un fichier qui se régénère à chaque affichage/téléchargement,
  • vous luttez pendant des heures à analyser les headers, etc : pourquoi mon envoi ne se passe pas comme prévu ?

Imacros

Imacros est pour l’instant la meilleure (ou plutôt la moins pire) solution que j’ai trouvée pour mes soucis d’automatisation. Le principe est simple : vous installez la version gratuite en tant que plugin firefox (il existe aussi une solution pour utiliser la version pro en trial de manière illimitée mais la version gratuite convient pour 90% des usages), et vous enregistrez votre « macro », un peu comme sous excel.

L’outil va mémoriser chacune de vos actions, et va les reproduire très rapidement dès que vous lancerez votre macro. Vous n’avez qu’à vous sensibiliser un peu au code d’imacros, qui est vraiment enfantin, pour pouvoir rapidement et facilement personnaliser vos macros.

Ainsi, de la création d’une plateforme par jour en utilisant cURL, je suis passé à 4/5 plateformes par jour en utilisant imacros.

Couplez imacros avec PHP

Il existe certaines faiblesses malgré tout.

Par exemple, une imacros est à « usage unique ». Cela signifie que vous ne pourrez pas gérer de « variables » dans votre macro, vous serez obligé de mettre le contenu de la variable en dur dans le code. C’est une difficulté facilement contournable par l’utilisation de « templates imacros », et la création d’une moulinette qui s’occupera de faire les search and replace comme expliqué sur le sujet précédemment cité.

Pour schématiser, vous enregistrez votre macro avec votre pseudo « toto » et votre mot de passe « confiture33″. Vous éditez votre macro et vous y mettez des valeurs « default » de type « monpseudo » et « monmotdepasse » : cela vous donne votre « template ». Lorsque vous voulez lancer un projet, vous passez un coup de search and replace (en PHP ou via un logiciel) où vous remplacez « monpseudo » et « monmotdepasse » par vos valeurs spécifiques au projet, par exemple si je crée un blog sur les anacondas : pseudo « anaconda58″.

Je lance ma macro : mon blog http://anaconda58.maplateforme.com est créé. Je supprime ma macro et je passe au projet suivant, projet sur les moustiques, avec ma moulinette qui me créera une macro avec comme valeur « moustique58″ dans le pseudo, etc.

Les captchas ? Les proxy ?

Coupler imacros avec decaptcher est simple comme bonjour. Il vous suffira d’héberger un script qui tournera en local. Vous lui enverrez l’image, le script règle ça via l’API de decaptcher et vous fourni le code retour.

Voici un exemple de code, que j’ai trouvé sur le net en cherchant comment faire pour plugger un decaptcher :

ONDOWNLOAD FOLDER=C:\wamp\www\api\ FILE=pic.jpg
TAG POS=1 TYPE=IMG ATTR=SRC:http://www.maplateforme.com/moncaptcha.php?show=* CONTENT=EVENT:SAVEITEM
TAB OPEN
TAB T=2
SET !TIMEOUT 60
URL GOTO=http://localhost/api/main.php
TAG POS=1 TYPE=BODY ATTR=TXT:* EXTRACT=TXT
SET !VAR3 {{!EXTRACT}}
TAB CLOSE
TAG POS=1 TYPE=INPUT:TEXT FORM=NAME:inscription ATTR=NAME:capcha CONTENT={{!VAR3}}

Et voici le script à héberger chez vous (remplacez par vos valeurs dans main.php).

Et pour répondre à Olivier Tassel avec qui je discutais hier de ça, pour les proxys ça ne pose pas de problème particulier ;)

Et le content spinning dans tout cela ?

Je me suis créé une moulinette en PHP qui me spinne tous mes champs (et qui me génère une identité fictive) lors de la génération de la macro. Ainsi, mes macros générées sont vraiment uniques les unes des autres. Il faudra que vous mettiez un peu la main à la pâte ;)

Si vous êtes intéressés par cette moulinette, je vais peut-être la vendre 15€, je ne sais pas encore.

Conclusion

Le gros conseil que je donne à l’heure actuelle, à tous ceux qui me demandent, est de vraiment vous lancer dans imacros. Cet outil est pour moi le meilleur compromis et surtout vous rend indépendant, ce qui n’a pas de prix. Il faudra vous sensibiliser rapidement à la « gamberge imacros », mais ce n’est pas très long, et de toute façon si vous avez la flemme de vous y mettre, ce n’est pas grave, il vous reste toujours la solution de tout faire manuellement :)

Bonne automatisation ;)

PS : pas mal le coup des liens vers des topics privés hein ? :D

{ 22 comments }

lemoussel de messenger août 25, 2010 à 12:57

Bienvenue SEO guy iMacros … :-)

Autre fonctionnalité intéressante de iMacros : La lecture / écriture dans un fichier en local. Donc dans certains cas nul besoin de « templates imacros » , ni d’une moulinette « search and replace ». Une simple boucle (loop) de lecture du fichier suffira !

Bruno Hug août 25, 2010 à 13:27

Bon article, j’avais lu deux trois choses sans trop me pencher sur Imacros. Globalement, tu dirais que si on a trouvé un truc qui permet de passer les systèmes en js (certains tout du moins), c’est la peine de s’y mettre ?

PS: tu as bien raison dans ton PS, je tuerai pour pouvoir m’inscrire sur ce forum…

512banque août 25, 2010 à 13:30

En fait, quand t’as lutté pendant des nuits entières (et je plaisante pas) sur un script cURL qui veut pas marcher, ben quand tu découvres iMacros, c’est vraiment le pied. J’incite toute personne en quête d’automatisation à se lancer.
Et si chacun respecte la syntaxe proposée par David, on pourra s’échanger les scripts ^^

Bruno Hug août 25, 2010 à 13:33

Et concernant le forum tu sais si y’a moyen en balançant un script d’avoir un login ou pas? Parce que je n’ai pas eu de réponse du tenancier sur Twitter…

512banque août 25, 2010 à 13:36

En fait tu t’es pas adressé à la bonne personne, tu t’es adressé à un bot qui scrape un peu de tout sur le net ;)
Demande à @rudy_som et je pense que si tu fais un bon partage, il te laissera t’inscrire. Mais le mieux est de voir avec lui directement.

Bruno Hug août 25, 2010 à 13:40

Je fais ça de suite, merci bien!

Keeg août 25, 2010 à 15:26

Je me penche dessus en ce moment. Je n’ai pas pu avant, d’autres chat à fouetter. D’ailleurs, j’ai ri aujourd’hui quand je suis tombé sur l’un de tes blogs vident « monnomblog.xxxxxxx.fr ». « Tiens, Imacro tourne ».

J’ai une question. Admettons que j’ai 10 macros. Je veux exécuter ces 10 macros d’un seul coup. Je les passe dans ma moulinette de remplacement des variables, mais je me retrouver avec 10 putains de fichiers différents. En gros, je cherche à copier / coller / dupliquer tout ça sur un grosse macro via php. Un coup de pouce ? :)

512banque août 25, 2010 à 15:38

Excellente question. Moi pour l’instant, je préfère tout exécuter, mais faire des « pauses » entre les fichiers, ça me permet de mieux maîtriser le processus. Pour tout automatiser, quand tu vas sur cette adresse : http://run.imacros.net/?m=Nomdemamacro.iim
Ca lance ta macro (essaie !).
Il suffit donc d’une « master macro » qui va visiter la liste de tes macros. Tu piges ? Cf la fin de l’article de lemoussel : http://www.seoblackout.com/2009/11/22/imacros-soumission-automatique-formulaire/

PS : je suis lot-et-garonnais d’origine :D

Keeg août 25, 2010 à 15:45

Ah ouais, pas mal comme truc, je vais utiliser ça si besoin. Merci.

Tu ne devais pas être très loin de mes bases alors… Franchement, être lot-et-garonnais et habiter en Savoie, c’est quand même le bad niveau climat. :)

Max de Raccoursisseur d'url août 25, 2010 à 16:14

Imacros est vraiment un bon outil mais je le trouve franchement galère pour faire des boucles for par exemple. Grosso modo, cela oblige à coder la boucle en javascript et écrire la macro en langage imacros.
Du coup, dans ces cas là, je trouve que je vais beaucoup plus vite avec Selenium IDE.
Et si vous êtes black très foncé, on lance le tout avec Selenium Grid :o )

Olivier de prefere toujours ses propres bots août 25, 2010 à 16:34

Je vois que tu n’as pas trainé entre la discussion d’hier et l’article ! :D

Je continue à examiner Imacro mais d’un oeil assez perplexe. Si le lui trouve bien certains avantages (passage du javascript notamment), je ne crois pas avoir vu par exemple qu’il était possible de faire du multi requête (je suis ouvert à un contre exemple) : en effet, la plupart de mes bots sont configurés pour « travailler » à raison de plusieurs centaines de requêtes simultanés mini…

LeMoussel août 25, 2010 à 17:33

@Max : Selenium ou iMacros thats is the Question !

Je pense que la philosophie de ces outils est différents. Selenium a été conçu pour du test d’application WEB et iMacros est plutôt conçu comme un langage de macros.
En son temps j’ai testé Selenium et je ne l’ai pas trouvé aussi « ergonomique » avec des difficultés d’apréhension par rapport à iMacros . Cela a peut être évolué depuis car la communauté sur Selenium est très active. Avantage non négligeable pour Selenium, c’est de l’Open Source et comme tu l’indique avec l’outil « grid », on a la possibilité de lancer les scenarii en //

Keeg août 25, 2010 à 17:34

@Max : Perso (et si c’est de ça que tu veux parler), pour des boucles, je mets les URLs scrappés dans un txt, et je balance un script PHP qui créé un gros iim avec les différentes URLs et les actions qui vont avec.

J’ai testé ça à l’arrache, et ça fonctionne. Le seul truc, c’est que si il y a un endroit où ça merde, bah le script s’arrête. Une solution ?

zebe août 26, 2010 à 0:01

Bravo pour le nouveau format du blog, celui-ci est vraiment plus agréable.
C’est une très bonne idée d’avoir couplé php à i-maccro, vous comptez vendre votre moulinette ?
Edit : pas de porn ici.

julien de référencement bordeaux août 26, 2010 à 8:08

A l’époque j’avais déjà vu un article sur seoblackout concernant imacros.
Je trouve l’outil très puissant mais le faite de ne pas pouvoir mettre une liste de mots (variables) m’avait repoussé.

Il est donc possible que ta « moulinette » pour les variables m’intéresse si ce n’est pas prise de tête à installer…

Ringout septembre 4, 2010 à 14:42

@keeg utilise ce code pour ignorer les erreurs
SET !ERRORIGNORE yes

NicolasR de agence referencement septembre 6, 2010 à 13:06

Tu m’as soufflé sur ce post :)

Je suis définitivement à la masse côté tech un truc de malade :D :)

Tanguy septembre 7, 2010 à 15:15

Hello,

Juste une question, si on veut passer par cURL ou par les sockets pour faire un bot, comment parvenir à récupérer l’image captcha et à renvoyer le code ?

Sachant qu’une image captcha est générée en php, a toujours le même nom et se regénère à chaque chargement de page. Donc un wget, fopen ou un CGI html2ps, 2pdf, etc… ne récupère pas la bonne image.

Bref, après 5 jours à me casser la tête sur le problème, y-a-t-il une solution hors uBot Studio ou Imacros ?

Au fait, pas forcément besoin de valider mon comm (en tout cas, vous avez mon mail si vous avez deux secondes pour me filer un petit coup de main…). Merci merci….

PyRaMiD septembre 11, 2010 à 0:11

Imacro est un peu chiant quand vous lancez une dizaine de script en même temps et que vous travaillez sur la machine en question, on perd constament le focus, et attention aux virus car les scripts executés en tâche de fond qui ont tendence à cliquer là ou il ne faut pas sont vite exploités par des personnes malveillantes ;)
Au delà de ça imacro est un outil génial et très facile à apprendre et le php n’est pas le seul moyen d’y inclure des variables, il y a de nombreux moyens de contourner le problème, les exemples de code avec différents langages sont nombreux.

Pour terminer merci beaucoup 512Banque pour ton blog qui est plutôt rafraichissant :)

PyRaMiD septembre 11, 2010 à 0:16

J’oubliais de dire un mot sur ubot http://ubotstudio.com/ que je trouve encore plus simple que imacro, malheureusement je n’ai pas eu l’occasion d’approfondir là dessus parcequ’il est un peu cher et que imacro me convient parfaitement.

Yann février 2, 2011 à 21:31

Salut,
Je fais un peu du deterrage de post, mais je viens chercher un peu d’aide à propos des captcha (Je demarre avec Imacro suite à ce post).
J’essaye d’extraire le captcha de ma page, mais je me retrouve sytematiquement avec un autre captcha car apparement il recharge la page
Ex : TAG POS=1 TYPE=IMG ATTR=SRC:http://monurl.com/captcha.php CONTENT=EVENT:SAVEITEM
Qq’un aurait une solution pour ceci ?
D’avance Merci

Amadeus de proteine mai 12, 2011 à 9:13

@Yann, tu te retrouves surement avec le captcha d’avant, tu peux essayer
FILEDELETE NAME=c:\pic.jpg

je commence imacros aussi :D j’arrive enfin a publier sur du wp il est vraiment stylé le soft
Amadeus@proteine´s last [type] ..CYTOSPORT Complete Whey Protein 2267 kg Fraise

Si vous avez trouvé ce blog via une liste de blogs dofollow, ne perdez pas votre temps, je refuse systématiquement tous les commentaires sauf ceux en valent réellement la peine ;)

Comments on this entry are closed.

{ 1 trackback }

Previous post:

Next post: