Référencement » Guide SEO » Noindex, nofollow

Balises noindex nofollow

Les balises meta index,follow / noindex,nofollow vous permettent de gérer le crawl et l’indexation de votre site.

Que sont les balises noindex nofollow ?

Pour être tout à fait précis, « noindex » et « nofollow » sont des valeurs possibles de l’attribut « content » de la balise meta.

<meta name= »robots » content= »index, follow« >

Néanmoins dans le langage courant, nous parlons de balises noindex et nofollow.

4 valeurs existent pour cette balise meta :

  • index : indique aux robots qu’ils doivent indexer la page (valeur par défaut)
  • noindex : indique aux robots qu’ils ne doivent pas indexer la page
  • follow : indique aux robots qu’ils doivent suivre les liens sur la page (valeur par défaut)
  • nofollow : indique aux robots qu’ils ne doivent pas suivre les liens

Quest-ce qu'une balise noindex ?

La balise noindex est une balise présente dans la section head de votre page. Elle indique aux moteurs de recherche de ne pas indexer la page, c’est-à-dire de ne pas l’inclure dans ses résultats.

Par défaut, la balise est « index », ce qui autorise les robots à indexer la page. Mettre une noindex est généralement une action manuelle. Elle s’effectue page à page pour vous permettre de décider précisément quelles pages indexer et non indexer.

Il est également possible d’ajouter une noindex générale sur tout votre site. Cela empêchera les moteurs de recherche d’indexer toutes les pages de votre site. Vous pouvez faire cela avec les CMS classiques.

Par exemple dans WordPress : Réglages > Lecture  > Visibilité par les moteurs de recherche : « Demander aux moteurs de recherche de ne pas indexer ce site

Qu'est-ce qu'une balise nofollow ?

La balise nofollow indique aux robots qu’ils ne doivent pas suivre les liens présents sur la page.

Cela est utile dans plusieurs cas, notamment lorsque des liens pointent vers des sources que vous jugez non fiables. Vous pouvez également vous en servir pour empêcher Google de passer sur certaines pages non stratégiques pour économiser du crawl budget.

Néanmoins, sachez que la valeur nofollow peut également s’appliquer à un seul lien, dans la balise < a>. Cela vous donne la possibilité de gérer vos liens au cas par cas plutôt que de nofollow une page entière.

Enfin, ajouter un nofollow à un lien externe n’empêchera pas la déperdition de popularité transmise par le lien. La page recevant le lien n’en bénéficiera pas non plus. Autrement dit, c’est une perte sèche de notoriété.

Quel est le rôle des balises noindex nofollow pour le SEO ?

Il est possible de combiner ces balises pour donner des directives précises aux robots de Google. Voici les différentes combinaisons :

<meta name="robots" content="index, follow">

C’est la valeur par défaut. Si jamais cette balise n’est pas dans votre code source, Google partira du principe que la page est indexable, et suivra ses liens.

<meta name="robots" content="noindex, nofollow">

Les robots n’indexeront pas la page, et ses liens ne seront pas pris en compte par les robots.

<meta name="robots" content="index, nofollow">

Les robots indexeront la page mais ne suivront pas les liens qu’elle fait. Cela peut être utile si la page possède beaucoup de liens pointant vers des sites de faible qualité.

<meta name="robots" content="noindex, follow">

Les robots n’indexeront pas la page, mais continueront de suivre les liens qu’elle fait.

Pour quelles pages les noindex et nofollow sont intéressants ?

Il n’y a pas de règles fixes. Vous devez simplement vous assurer que vos pages stratégiques soient indexables, et que les non stratégiques ne le soient pas. Généralement, on ajoute une balise noindex à certains groupes de pages qui peuvent être nuisibles pour le SEO :

  • • Les pages auteurs
  • • Les pages archives
  • • Certaines taxonomies ou Custom Post Type
  • • Les pages de remerciements
  • • Les pages d’admin et de connexion
  • • Les pages générées par les moteurs de recherche interne

Les erreurs fréquentes à éviter

La méthode la plus courante pour noindexer une page est d’ajouter la balise meta noindex en HTML dans la section head de la page, ou dans le response headers. 

Pour qu’un robot voit que la page a une balise noindex, il doit être capable de lire son code source. Il ne faut donc pas bloquer le crawl du robot (via le fichier robots.txt), car cela l’empêche de lire le code source de la page. Si le crawl est bloqué, le robot ne voit pas la balise noindex.

Cela est problématique dans le cas où vous auriez déjà des pages non stratégiques indexées. Dans ce cas, il faudra d’abord faire désindexer les pages stratégiques (c’est-à-dire les faire sortir des résultats de recherche de Google), puis ensuite interdire le crawl pour que les robots ne passent plus sur la page.

Si vous interdisez le crawl de la page, puis que vous ajoutez une balise noindex, les robots ne passeront plus sur la page avant de voir qu’il faut désindexer la page. Votre page non stratégique restera donc indexée.

Comment voir la balise meta index,follow dans la page ?

Il y a différents moyens simples de consulter les balises noindex nofollow

  • • Dans le code source : recherchez la balise meta name « robots » et regardez ses valeurs.
  • Via un crawler : Par exemple avec Screaming Frog qui vous donne en un coup d’oeil les valeurs pour toutes les pages de votre site.
  • Via l’addon Web developer : Vous pouvez consulter le fichier X-Robots-Tags pour vous assurer qu’une directive noindex n’est présente.
Shopping Basket