Parfois, Google fait des annonces sur de nouvelles fonctionnalités et nous disons «Pourquoi est-ce qu’ils ont fait cela?» Cette semaine, nous en avons eu un. Google a introduit un nouvel ensemble de méta-commandes de robots, qui permet aux sites de limiter l’affichage de leurs extraits dans les résultats de la recherche. Il y a une raison à cela, mais ils l’ont enterrée très loin.

Avec leurs méta-commandes de robots nouvellement introduites, vous pouvez «dire» des choses comme: Je ne veux pas que vous montriez plus de 200 caractères de mon site! Ou: je ne veux pas que vous montriez des images de mon site. Rien de tout cela n’avait de sens pour nous. Pourquoi une personne qui souhaite vraiment optimiser les résultats de recherche de Google devrait-elle faire cela?

Une loi française sur le droit d’auteur

Tout à coup, nous prenons un tournant dramatique: la France a en effet introduit une nouvelle loi sur le droit d’auteur, qui est la première mise en œuvre de la nouvelle loi européenne sur le droit d’auteur. Je ne suis pas avocat, mais comme Google l’explique dans ce billet de blog, les éditeurs doivent s’inscrire pour afficher leurs extraits de code, alors que par le passé, vous deviez vous désabonner. Notez que cet article de blog est en français, sur leur blog français, mais il existe une version anglaise au bas de cet article.

Il s’avère que vous pouvez également utiliser ces nouvelles méta-fonctionnalités de robots pour activer tous ces affichages. Fondamentalement, utilisez les méta-robots pour activer l’affichage de votre extrait de texte, de vos vidéos et de vos images.

Comme cette loi française met en œuvre la nouvelle loi européenne, il est probable que les autres applications de cette loi sur le droit d’auteur à travers l’Europe exigeront une action similaire. Cela signifierait que davantage de pays auraient besoin de s’inscrire s’ils ne voulaient pas perdre leurs extraits. Nous ne le savons pas, bien sûr, mais bien sûr: mieux vaut prévenir que guérir.

Les différentes valeurs des balises Meta des robots

Les valeurs suivantes (‘paramètres’) peuvent être placées seules ou ensemble dans l’attribut content de balise (séparées par une virgule) pour contrôler l’interaction des moteurs de recherche avec votre page.

Faites défiler la liste pour voir quels moteurs de recherche prennent en charge quels paramètres spécifiques.

  • index

Autoriser les moteurs de recherche à ajouter la page à leur index, de manière à ce qu’elle puisse être découverte par les personnes effectuant une recherche.

  • noindex

Empêchez les moteurs de recherche d’ajouter cette page à leur index et, par conséquent, empêchez-la de l’afficher dans leurs résultats.

  • follow

Indique aux moteurs de recherche qu’il peut suivre des liens sur la page pour découvrir d’autres pages.

  • nofollow

Indique aux robots des moteurs de recherche d ’« approuver »(passer l’équité) de tout lien sur la page.

  • none

Un raccourci pour noindex, nofollow.

  • all

Un raccourci pour l’index, follow .

  • noimageindex

Interdire aux moteurs de recherche d’indexer des images sur la page.

  • noarchive

Empêche les moteurs de recherche d’afficher une copie en cache de cette page dans leurs listes de résultats de recherche.

  • nocache

Identique à noarchive, mais uniquement utilisé par MSN / Live.

  • nosnippet

Empêche les moteurs de recherche d’afficher un extrait de texte ou une séquence vidéo (c’est-à-dire une méta-description) de cette page dans les résultats de la recherche et les empêche d’afficher une copie en cache de cette page dans leurs listes de résultats de recherche.

  • nostranslate

Empêche les moteurs de recherche d’afficher les traductions de la page dans leurs résultats de recherche.

  • Unavailable_after

Indique aux moteurs de recherche une date / heure après laquelle ils ne doivent pas l’afficher dans les résultats de recherche; une version «temporisée» de noindex.

  • noyaca

Empêche l’extrait de résultats de recherche d’utiliser la description de la page du répertoire Yandex.

  • noydir

Empêche Yahoo d’utiliser la description de cette page du répertoire Yahoo comme extrait de votre page dans les résultats de la recherche.

Quel moteur de recherche prend en charge les valeurs de méta-tags de robots?

Ce tableau indique quels moteurs de recherche prennent en charge quelles valeurs. Notez que la documentation fournie par certains moteurs de recherche est rare, il y a donc beaucoup d’inconnues.

Robots value Google Yahoo Bing Ask Baidu Yandex
index Y* Y* Y* ? Y Y
noindex Y Y Y ? Y Y
follow Y* Y* Y* ? Y Y
nofollow Y Y Y ? Y Y
none Y ? ? ? N Y
all Y ? ? ? N Y
noimageindex Y N N ? N N
noarchive Y Y Y ? Y Y
nocache N N Y ? N N
nosnippet Y N Y ? N N
notranslate Y N N ? N N
unavailable_after Y N N ? N N
noodp N Y** Y** ? N N
noydir N Y** N ? N N
noyaca N N N N N Y

Règles pour les moteurs de recherche spécifiques

Parfois, vous pouvez vouloir donner des instructions spécifiques à un moteur de recherche spécifique, mais pas à d’autres. Ou vous pouvez vouloir donner des instructions complètement différentes à différents moteurs de recherche.

Dans ces cas, vous pouvez modifier la valeur de l’attribut de contenu pour un moteur de recherche spécifique (par exemple, GOOGLEBOT ou MSNBOT).

Remarque: étant donné que les moteurs de recherche ignorent simplement les instructions qu’ils ne prennent pas en charge ou ne comprennent pas, il est très rare de devoir utiliser plusieurs balises meta robots pour définir des instructions pour des robots spécifiques.

Paramètres en conflit et fichiers robots.txt

N’oubliez pas que les balises meta robots fonctionnent différemment des instructions de votre fichier robots.txt et que des règles contradictoires peuvent entraîner des comportements inattendus. Par exemple, les moteurs de recherche ne pourront pas voir vos balises méta si la page est bloquée via le fichier robots.txt.

Veillez également à éviter de définir des valeurs conflictuelles dans votre balise meta robots (telles que l’utilisation des paramètres index et noindex), en particulier si vous définissez des règles différentes pour différents moteurs de recherche. En cas de conflit, l’interprétation la plus restrictive est généralement choisie (c’est-à-dire que “ne pas montrer” bat habituellement “visionner”).