Référencement » Guide SEO » Noindex, nofollow
Les balises meta index,follow / noindex,nofollow vous permettent de gérer le crawl et l’indexation de votre site.
Pour être tout à fait précis, « noindex » et « nofollow » sont des valeurs possibles de l’attribut « content » de la balise meta.
<meta name= »robots » content= »index, follow« >
Néanmoins dans le langage courant, nous parlons de balises noindex et nofollow.
4 valeurs existent pour cette balise meta :
La balise noindex est une balise présente dans la section head de votre page. Elle indique aux moteurs de recherche de ne pas indexer la page, c’est-à-dire de ne pas l’inclure dans ses résultats.
Par défaut, la balise est « index », ce qui autorise les robots à indexer la page. Mettre une noindex est généralement une action manuelle. Elle s’effectue page à page pour vous permettre de décider précisément quelles pages indexer et non indexer.
Il est également possible d’ajouter une noindex générale sur tout votre site. Cela empêchera les moteurs de recherche d’indexer toutes les pages de votre site. Vous pouvez faire cela avec les CMS classiques.
Par exemple dans WordPress : Réglages > Lecture > Visibilité par les moteurs de recherche : « Demander aux moteurs de recherche de ne pas indexer ce site
La balise nofollow indique aux robots qu’ils ne doivent pas suivre les liens présents sur la page.
Cela est utile dans plusieurs cas, notamment lorsque des liens pointent vers des sources que vous jugez non fiables. Vous pouvez également vous en servir pour empêcher Google de passer sur certaines pages non stratégiques pour économiser du crawl budget.
Néanmoins, sachez que la valeur nofollow peut également s’appliquer à un seul lien, dans la balise < a>. Cela vous donne la possibilité de gérer vos liens au cas par cas plutôt que de nofollow une page entière.
Enfin, ajouter un nofollow à un lien externe n’empêchera pas la déperdition de popularité transmise par le lien. La page recevant le lien n’en bénéficiera pas non plus. Autrement dit, c’est une perte sèche de notoriété.
Il est possible de combiner ces balises pour donner des directives précises aux robots de Google. Voici les différentes combinaisons :
<meta name="robots" content="index, follow">
C’est la valeur par défaut. Si jamais cette balise n’est pas dans votre code source, Google partira du principe que la page est indexable, et suivra ses liens.
<meta name="robots" content="noindex, nofollow">
Les robots n’indexeront pas la page, et ses liens ne seront pas pris en compte par les robots.
<meta name="robots" content="index, nofollow">
Les robots indexeront la page mais ne suivront pas les liens qu’elle fait. Cela peut être utile si la page possède beaucoup de liens pointant vers des sites de faible qualité.
<meta name="robots" content="noindex, follow">
Les robots n’indexeront pas la page, mais continueront de suivre les liens qu’elle fait.
Il n’y a pas de règles fixes. Vous devez simplement vous assurer que vos pages stratégiques soient indexables, et que les non stratégiques ne le soient pas. Généralement, on ajoute une balise noindex à certains groupes de pages qui peuvent être nuisibles pour le SEO :
La méthode la plus courante pour noindexer une page est d’ajouter la balise meta noindex en HTML dans la section head de la page, ou dans le response headers.
Pour qu’un robot voit que la page a une balise noindex, il doit être capable de lire son code source. Il ne faut donc pas bloquer le crawl du robot (via le fichier robots.txt), car cela l’empêche de lire le code source de la page. Si le crawl est bloqué, le robot ne voit pas la balise noindex.
Cela est problématique dans le cas où vous auriez déjà des pages non stratégiques indexées. Dans ce cas, il faudra d’abord faire désindexer les pages stratégiques (c’est-à-dire les faire sortir des résultats de recherche de Google), puis ensuite interdire le crawl pour que les robots ne passent plus sur la page.
Si vous interdisez le crawl de la page, puis que vous ajoutez une balise noindex, les robots ne passeront plus sur la page avant de voir qu’il faut désindexer la page. Votre page non stratégique restera donc indexée.
Il y a différents moyens simples de consulter les balises noindex nofollow