Ayant quelques amis ingénieurs informaticiens, votre coach en séduction d'un jour, (c'est à dire moi même) a conçu un programme pour leur faciliter la vie.
Car tout le monde le sait, l'ingénieur informaticien :
- Est jeune, et généralement avec des lunettes et plein de boutons,
- Il parle un langage souvent incompréhensible,
- Il vit avec un rat, ou un mulot, un truc comme ça relié par la queue à son ordinateur,
- Il prend les autres pour des échappés de la grotte aux mammouths,
- Et généralement il est célibataire (faut pas s'étonner).
Pour ceux qui en douteraient, ce chapitre est donc extrêmement sérieux !
Car tout le monde le sait, l'ingénieur informaticien :
- Est jeune, et généralement avec des lunettes et plein de boutons,
- Il parle un langage souvent incompréhensible,
- Il vit avec un rat, ou un mulot, un truc comme ça relié par la queue à son ordinateur,
- Il prend les autres pour des échappés de la grotte aux mammouths,
- Et généralement il est célibataire (faut pas s'étonner).
Photo du site http://www.informatiquegifs.com/
Pour ceux qui en douteraient, ce chapitre est donc extrêmement sérieux !
En effet par le sujet léger ici abordé, et malgré son ton un peu humoristique, le but est d'apprendre ce que c'est que le scraping, branche du "growth hacking".
Ces deux termes sont apparus assez récemment, mais le concept existait depuis bien longtemps, chacun faisant du scraping comme M Jourdain faisait de la prose.
A l'époque déjà lointaine du minitel, votre serviteur ici présent avait construit un cable qui reliait la sortie 5 broches du minitel, au port série 9 broches de son ordinateur.
Grace à un programme "maison", je récupérais sur le "11" ou "36-11", l'annuaire téléphonique professionnel des assureurs, et faisait ensuite un publipostage qui me permettait de mettre chaque année mon assureur préféré en concurrence, pour mes différentes polices (auto, habitation).
Je dois vous dire que c'était très intéressant !
Mais je n'étais pas le seul à utiliser ce genre de techniques, un de mes amis, habitant en Touraine, et qui travaillait dans son coin sur des sujets analogues, avait lui aussi fabriqué un système équivalent.
Pour en revenir à notre cas pratique, comme vous le savez tous, il existe un marché de la rencontre, qui est régi par deux choses :
A l'époque déjà lointaine du minitel, votre serviteur ici présent avait construit un cable qui reliait la sortie 5 broches du minitel, au port série 9 broches de son ordinateur.
Grace à un programme "maison", je récupérais sur le "11" ou "36-11", l'annuaire téléphonique professionnel des assureurs, et faisait ensuite un publipostage qui me permettait de mettre chaque année mon assureur préféré en concurrence, pour mes différentes polices (auto, habitation).
Je dois vous dire que c'était très intéressant !
Mais je n'étais pas le seul à utiliser ce genre de techniques, un de mes amis, habitant en Touraine, et qui travaillait dans son coin sur des sujets analogues, avait lui aussi fabriqué un système équivalent.
Pour en revenir à notre cas pratique, comme vous le savez tous, il existe un marché de la rencontre, qui est régi par deux choses :
- un petit noyau de sites web mettent en relation des protagonistes demandeurs. Les demandeurs ne perdent pas de temps à se déplacer dans les endroits traditionnels ordinairement dévolus aux rencontres ; ils peuvent depuis chez eux commencer leur recherche, grace à leur gros nordinateur.
- le deuxième point important est que comme pour l'entreprise, il faut soigner sa communication, et l'ordinateur est là pour vous y aider. Ainsi souhaiter un bon anniversaire, prendre des nouvelles de la personne qui ne s'est pas connectée depuis quatre jours ... sont des choses vivement recommandées. En fonction de la réponse, vous avisez.
Rappelons que au cas particulier, le growth hacking, c'est la nouvelle forme de
publicité ciblée. Si votre produit n'est pas adapté au marché, (par exemple si vous êtes petit, gros, chauve et avec des lunettes), il est
préférable de réfléchir à l'adaptation du produit (faire du sport, des implants capillaires, etc), plutôt que d'investir dans un
secteur qui ne va pas produire le rendement escompté.
Bien évidemment le scraping peut etre appliqué à plein de domaines ; certains par exemple s'en servent pour les opérations suivantes :
- Récupérer une liste d'entreprises d'un secteur pour leur envoyer mon CV,
- recherche de clients ou de produits sur des sites de e-commerce,
- Recherche des opportunités sur certains sites, comme seloger.com, afin de réaliser un investissement, etc.
Bien évidemment le scraping peut etre appliqué à plein de domaines ; certains par exemple s'en servent pour les opérations suivantes :
- Récupérer une liste d'entreprises d'un secteur pour leur envoyer mon CV,
- recherche de clients ou de produits sur des sites de e-commerce,
- Recherche des opportunités sur certains sites, comme seloger.com, afin de réaliser un investissement, etc.
Pour faire du scraping, il vous faut :
- Un site à scraper
- Un (des) outils de scraping.
Tous les sites à scraper ne se valent pas. Exemple : Si vous cherchez des informations sur google, vous pouvez avoir entre 500 et 1000 réponses très ciblées ; si vous faites la même recherche sur bing, vous aurez bien davantage de réponses.
Il existe différents produits de scraping : Selenium, Chrome Headless via Nodejs + Puppeteer, etc ; mais ils sont peu aisés à utiliser pour celui qui ne connait pas VBscript.
La solution la plus raisonnable serait de se former au développement,
car une fois quelques connaissances de base acquises, beaucoup de choses
deviennent possibles.
Je laisse la porte ouverte aux informaticiens, moi j'ai pas trop le temps.
Cependant ici nous allons étudier une solution assez intuitive, nommée Parsehub ; cette solution existe depuis 2013, la version d'essai est déjà sympathique et gratuite.
La vidéo ci après se déroule en trois temps :
- Installation sur système linux (mais cela marche aussi sur windows et mac),
- Présentation du programme ; cas d'un site dont l’accès est réservé aux inscrits ;