La bonne pratique en référencement veut que l’on montre un site web de manière identique aux robots tels que GoogleBot et aux visiteurs. Ce qui signifie qu’il ne faut jamais modifier le contenu en fonction des paramètres tels que le navigateur, l’IP ou la langue du navigateur.

Cependant, il s’agit là plus d’un aveu de faiblesse du géant américain, qui jusqu’à maintenant ne pouvait explorer les sites web qu’avec une IP américaine, donc en se mettant dans la peau d’un américain… Car, de nombreux sites internationaux souhaiteraient pouvoir afficher un contenu différent selon la langue préférée du navigateur, ou selon l’IP du visiteur.

C’est le cas par exemple de Facebook, il est facile de faire le test : il suffit de modifier la langue préférée du navigateur (voir la copie écran ci -dessous), puis de retourner sur la page d’accueil de Facebook, en mode déconnecté : la langue du contenu est celle de la langue choisie dans les paramètres du navigateur, et ce, sur la même URL, c’est-à-dire https://www.facebook.com/

Cette problématique de référencement d’une version d’une page dans une langue donnée dans les moteurs de recherche ne se pose que si l’URL de la page est la même, quelle que soit la langue. En effet, dans le cas plus courant d’une redirection vers un site distinct (par exemple, https://www.airbnb.fr/ pour la version française de AIRBNB, https://www.airbnb.com/ pour la version américaine), il est impératif de gérer les domaines multi-langue par l’utilisation correcte des balises hreflang, comme l’indique d’ailleurs Google dans son article.

Cependant, depuis peu, et l’information est restée confidentielle, Google a amélioré son robot d’exploration GoogleBot afin de pouvoir se mettre dans la peau d’internautes situés à d’autres endroits du globe. Google a pour cela deux nouvelles méthodes d’exploration, que nous allons vous détailler :

  • Exploration géodistribuée
  • Exploration en fonction de la langue

EXPLORATION GÉODISTRIBUÉE

C’est un terme un peu complexe pour simplement décrire le fait que Google peut explorer votre site depuis des IPs autres qu’américaines. Désormais, il faut en tenir compte : GoogleBot peut utiliser des IP internationales, comme vos visiteurs. Le robot est donc en mesure de voir votre site comme le verrait un internaute situé en Chine ou en Allemagne.

EXPLORATION EN FONCTION DE LA LANGUE

GoogleBot peut également simuler le comportement du navigateur et envoyer une entête (les “headers” des requêtes HTTP) de type “Accept-Language“, afin de vérifier le contenu adaptatif de la page ainsi lue.

VÉRIFIER LE COMPORTEMENT DE VOTRE SITE

Dans votre cas, si vous aviez effectivement prévu de fournir un contenu adapté à la langue du navigateur ou à la géolocalisation de l’IP du visiteur, comment vérifier ce qu’envoie réellement votre site ?

Si vous avez un développeur compétent sous la main, vous pouvez lui demander de coder un script se comportant comme GoogleBot, utilisant par exemple la librairie CURL afin d’envoyer les entêtes HTTP appropriées, ou en passant par un proxy pour modifier l’IP d’origine de la requête.

Mais il y a plus simple : il existe un petit outil permettant de faire ce test, appelé Locale Adaptative Pages Testing Tool. Cet outil gratuit permet en effet de tester une page web en simulant différents paramètres d’Accept-Language à la fois, et de vérifier les redirections effectuées, la langue détectée, et les principales balises SEO de la page (title et h1 notamment).

CONCLUSION : POURQUOI COMPRENDRE GOOGLEBOT

Il arrive bien fréquemment qu’on néglige l’analyse des logs d’un site ainsi que le comportement de GoogleBot. La fonctionnalité “Explorer comme Google” proposée par la Search Console de Google est sur ce sujet très pratique, car elle permet de remonter les alertes d’exploration et de voir une page de votre site comme la voit le robot de Google. 

Vous ne devez pas passer à côté de cette vision, certes très technique, mais très utile, de votre site, car si Google rencontre des soucis pour explorer une de vos pages, ou s’il se trompe sur la langue du contenu, ou s’il référence une page de manière différente que la voit l’internaute, il y a risque de frein important au référencement, voire de pénalité.