Cet article est très largement inspiré de la conférence « L’impact du Big Data et Machine Learning sur le marketing en ligne » au SEO Camp 2017, par Rodolphe Quenette, d’ Authoritas & Cécile Beroni, responsable SEO chez Price Minister.
Sommaire
- Prédire le crawl de Google afin de l’optimiser
- Prédiction des meilleurs mots clés
- Prédictions sur les urls
Chez Price Minister, le SEO c’est :
- 24 millions de pages
- 17 millions de page indexées
- 30-40% des visites totales
D’où des problématiques très fortes en Big Data..
L’objectif de cet article n’est pas d’être exhaustif sur ces méthodes, ni même de donner des réponses complètes: Price Minister veut bien nous dire ce qu’il fait, mais pas dévoiler toutes les recettes, quand même !
Vous connaissez la recette du Nutella vous ?
>> L’objectif est plutôt de lister 3 exemples concrets d’optimisations liées au big data sur lesquelles PriceMinister a travaillé.
Prédire le crawl de Google afin de l’optimiser
Au départ, le crawl de tout le site de Price Minister mettait…6 mois! Et donc les crawls de Google n’étaient jamais bien à jour, et donc ben, ca ne marchait pas fort :).
>>Il a fallu réfléchir à comment optimiser le crawl de Google : comment lui faire crawler ce que l’on veut, optimiser la mise en cache en fonction de cela, pour faire en sorte que, dans le temps quotidien de crawl que Google nous offre, il le passe sur les choses qui comptent !
- Price Minister a réussi à prédire 80% des urls qui seront crawlées par Google chaque jour !
- Et donc une grosse possibilité d’optimisation de la mise en cache, du temps de rotation, etc..
Prédiction des meilleurs mots clés
L’analyse de mots clés, souvent, ca se passe plutôt bien sur quelques mots clés..cf par exemple cet article sur la recherche de mots clés. Mais comment faire quand on ne parle pas de quelques centaines de mots clés, mais de millions ?
Voici un exemple de méthodo :
- Extraction de tous les h1 de toutes les pages :
- on peut en détecter les mots clés
- puis regarder du coup tous les mots clés similaires en regardant pour chacun les résultats de Google
- et donc en regardant les h1 des concurrents :
- et on boucle..
- et hop, on récupère … 2,4 millions d’opportunités de mots clés !!
- Bon bien sûr ensuite, il faut les traiter ces données…
- Scoring de mots clés : on va trier par volume de recherche, facilité, vérifier (quand même!) qu’on a bien les produits derrière, et zou, on aura une liste priorisée. Ensuite forcément, sur un site comme Priceminister, on peut créer rapidement des landing pages pour chacun, donc zou, ce n’est pas un souci :) (je sais, ce n’est pas le cas pour tout le monde!). Bon, on revient au scoring :
- comment estimer la capacité de ranking sur chacun des mots clés ?
- bien sûr :
- search volume
- CPC
- CTR %
- et en plus : Url des competitors avec données Majestic: Trust Flow, Citation Flow, et analyse versus la meilleure page du site de priceminister sur ce mot clé, pour comprendre notre data par rapport aux leurs
- et bien d’autres apparemment, mais ca on ne le saura pas !
Prédictions sur les urls
Au-delà du mot clé, on va essayer de connaître les urls au plus fort potentiel de croissance. Car étant donné le volume de pages, on ne va pas pouvoir tout travailler.
Et puis après tout, regarder les urls, ça fait sens non ? Un site web, le SEO, on parle toujours de mots clés, mais à la fin, concrètement, c’est des pages qu’on gère non ? :)
Là on travaille du coup par catégorie, par cocon, cluster, utilisez le mot que vous préférez, et ensuite on envoie de l’analyse.
Par exemple le cluster sémantique « bijoux »:
- on regarde ces urls versus les urls des concurrents
- on typologise ces urls avec par exemple des données Majestic
- là on va pouvoir détecter les pages à plus haut potentiel d’amélioration en comparant nos pages à celles-ci, et à comprendre ce qui manque chez nous, d’un point de vue on-page, maillage, etc..
Voilà, c’est donc la fin de ce petit article qui donne quelques pistes sur la façon dont on peut utiliser le Machine Learning et le Big Data pour optimiser sa stratégie SEO quand on gère une marketplace de plusieurs dizaines de millions de pages web.
Complétez votre lecture
Le guide complet pour utiliser la Google Search Console
Google Search Console : outil gratuit fourni par Google pour analyser la performance SEO de votre site web.