Correction du rapport de couverture de Google Search Console ‘Pages exclues’


Google Search Console vous permet de voir votre site Web à travers les yeux de Google.

Vous obtenez des informations sur les performances de votre site Web et des détails sur l’expérience de la page, les problèmes de sécurité, l’exploration ou l’indexation.

La partie Exclus du rapport de couverture de l’index de Google Search Console fournit des informations sur l’état d’indexation des pages de votre site Web.

Découvrez pourquoi certaines pages de votre site Web apparaissent dans le rapport Exclus de Google Search Console et comment y remédier.

Qu’est-ce que le rapport de couverture d’index ?

Les Rapport de couverture de la console de recherche Google affiche des informations détaillées sur l’état de l’index des pages Web de votre site Web.

Vos pages Web peuvent appartenir à l’un des quatre compartiments suivants :

  • Erreur: Les pages que Google ne peut pas indexer. Vous devriez consulter ce rapport, car Google pense que vous souhaiterez peut-être indexer ces pages.
  • Valable avec réserves: les pages que Google indexe, mais il y a quelques problèmes que vous devez résoudre.
  • Valide: Les pages que Google indexe.
  • exclu: Les pages qui sont exclues de l’index.

Rapport de couverture de la console de recherche Google

Que sont les pages exclues ?

Google n’indexe pas les pages dans les compartiments Erreur et Exclu.

La principale différence entre les deux est :

  • Google pense que les pages d’erreur doivent être indexées, mais ils ne le peuvent pas en raison d’une erreur qu’ils doivent examiner. Par exemple, les pages non indexables soumises via un sitemap XML sont classées comme Erreur.
  • Google pense que les pages du groupe Exclus doivent être exclues, et c’est leur intention. Par exemple, les pages non indexables qui ne sont pas soumises à Google apparaîtront dans le rapport Exclus.
    Pages exclues de GSCCapture d’écran de Google Search Console, mai 2022

Cependant, Google ne fait pas toujours les choses correctement et les pages qui doivent être indexées vont parfois dans Exclus.

Heureusement, Google Search Console fournit la raison pour laquelle les pages sont placées dans un compartiment spécifique.

C’est pourquoi il est recommandé d’examiner attentivement les pages des quatre compartiments.

Explorons maintenant le cube Exclus.

Raisons possibles des pages exclues

Il existe 15 raisons possibles pour lesquelles vos pages Web sont dans le groupe Exclus. Examinons chacun de plus près.

Exclu par la balise “noindex”

Ce sont les URL qui ont une balise “noindex”.

Google pense que vous voulez en fait exclure ces pages de l’indexation car vous ne les incluez pas dans le sitemap XML.

Il peut s’agir, par exemple, de pages de connexion, de pages d’utilisateurs ou de pages de résultats de recherche.

Console de recherche Google exclue par une balise noindex

Actions suggérées:

  • vérifier ces URL être sûr de toi vous souhaitez les exclure de l’index de Google.
  • Vérifier si une balise “noindex” est encore/vraiment présente à ces URL.

Suivi : actuellement non indexé

Google a exploré ces pages et ne les a pas encore indexées.

Comme le dit Google dans son Documentation, l’URL de ce référentiel “peut ou non être indexée à l’avenir ; pas besoin de soumettre à nouveau cette URL pour exploration. »

De nombreux professionnels du référencement ont noté qu’un site pouvait avoir de sérieux problèmes de qualité si de nombreuses pages indexables normales devenaient explorées, non indexées actuellement.

Cela pourrait signifier que Google a exploré ces pages et ne pense pas qu’elles fournissent suffisamment de valeur pour être indexées.

Google Search Console actuellement exploré non indexéCapture d’écran de Google Search Console, mai 2022

Actions suggérées:

  • Vérifiez la qualité de votre site Web et mange.

Découvert : actuellement non indexé

Comme l’indique la documentation de Google, la page Découverte actuellement non indexée “a été trouvée par Google, mais pas encore explorée”.

Google n’a pas crawlé la page pour ne pas surcharger le serveur. Un grand nombre de pages dans ce bucket peut signifier que votre site a des problèmes de budget d’exploration.

Google Search Console découvert actuellement non indexéCapture d’écran de Google Search Console, mai 2022

Actions suggérées:

  • Vérifiez la santé de votre serveur.

Non trouvé (404)

Ce sont les pages qui ont renvoyé le code d’état 404 (introuvable) à la demande de Google.

Ce ne sont pas des URL soumises à Google (c’est-à-dire dans un sitemap XML), mais ces pages ont été découvertes par Google (c’est-à-dire via un autre site Web renvoyant à une ancienne page supprimée il y a longtemps).

Pages exclues dans GSC - 404Capture d’écran de Google Search Console, mai 2022

Actions suggérées:

  • Consultez ces pages et décider s’il faut implémenter une redirection 301 vers une page de travail.

lisse 404

Soft 404, dans la plupart des cas, est une page d’erreur qui renvoie le code d’état OK (200).

Alternativement, il peut également s’agir d’une page mince qui contient peu ou pas de contenu et utilise des mots comme “désolé”, “erreur”, “introuvable”, etc.

Soft 404 dans Google Search ConsoleCapture d’écran de Google Search Console, mai 2022

Actions suggérées:

  • Dans le cas d’une page d’erreur, assurez-vous de renvoyer le code d’état 404.
  • Pour les pages avec peu de contenu, ajouter du contenu unique pour aider Google à reconnaître cette URL en tant que page distincte.

Page avec redirection

Toutes les pages redirigées de votre site Web iront dans le compartiment Exclus, où vous pourrez voir toutes les pages redirigées que Google a détectées sur votre site Web.

Page avec redirection dans Google Search ConsoleCapture d’écran de Google Search Console, mai 2022

Actions suggérées:

  • Vérifiez les pages redirigées pour s’assurer que les redirections ont été implémentées intentionnellement.
  • Certains plugins WordPress créent automatiquement des redirections lorsque l’URL change, vous voudrez peut-être les vérifier de temps en temps.

Dupliquer sans canonique sélectionné par l’utilisateur

Google pense que ces URL sont des doublons d’autres URL de votre site Web et ne doivent donc pas être indexées.

Vous n’avez pas défini de balise canonique pour ces URL, et Google a sélectionné la balise canonique en fonction d’autres signaux.

Actions suggérées:

  • Inspectez ces URL pour vérifier quelles URL canoniques Google a sélectionné pour ces pages.

Dupliquer, Google a choisi un canonique différent de celui de l’utilisateur

Page exclue de GSCCapture d’écran de Google Search Console, mai 2022

Dans ce cas, vous avez déclaré une URL canonique pour la page, mais Google a quand même sélectionné une URL différente comme canonique. En conséquence, le canonique sélectionné par Google est indexé et celui sélectionné par l’utilisateur ne l’est pas.

Mesures possibles :

  • Inspectez l’URL pour vérifier quel canonique Google sélectionné.
  • Analysez les signaux possibles qui ont poussé Google à choisir un canonique différent (c’est-à-dire des liens externes).

URL soumise en double non sélectionnée comme canonique

La différence entre le premier état et cet état est que dans le cas du second, vous avez soumis une URL à Google pour indexation sans déclarer son adresse canonique, et Google pense qu’une URL différente serait une meilleure URL canonique.

En conséquence, l’URL canonique sélectionnée par Google est indexée à la place de l’URL soumise.

Actions suggérées:

  • Inspectez l’URL pour vérifier quel canonique Google a sélectionné.

Page alternative avec la balise canonique appropriée

Ce sont simplement les doublons des pages que Google reconnaît comme URL canoniques.

Ces pages ont les adresses canoniques pointant vers l’URL canonique correcte.

Actions suggérées:

  • Dans la majorité des cas, Aucune action n’est requise.

Bloqué par robots.txt

Ce sont les pages que robots.txt a bloquées.

Lors de l’analyse de ce cube, gardez à l’esprit que Google peut toujours indexer ces pages (et les afficher de manière “cassé”) si Google trouve une référence à celles-ci sur, par exemple, d’autres sites Web.

Actions suggérées:

  • Vérifiez si ces pages sont bloquées à l’aide du testeur robots.txt.
  • Ajoutez une balise “noindex” et supprimez les pages de robots.txt si vous souhaitez les supprimer de l’index.

Bloqué par l’outil de suppression de page

Ce rapport répertorie les pages dont la suppression a été demandée par l’outil Suppressions.

Veuillez noter que cet outil ne supprime les pages des résultats de recherche que temporairement (90 jours) et ne les supprime pas de l’index.

Actions suggérées:

  • Vérifiez si les pages soumises via l’outil Takedowns doit être temporairement supprimé ou avoir une balise ‘noindex’.

Bloqué en raison d’une demande non autorisée (401)

Pour ces URL, Googlebot n’a pas pu accéder aux pages en raison d’une demande d’autorisation (code d’état 401).

À moins que ces pages ne soient mises à disposition sans autorisation, vous n’avez rien à faire.

Google vous informe simplement de ce qu’il a trouvé.

401 pages sur GoogleCapture d’écran de Google Search Console, mai 2022

Actions suggérées:

  • Vérifiez si ces pages doivent vraiment nécessiter une autorisation.

Bloqué en raison d’un accès interdit (403)

Ce code d’état est généralement le résultat d’une erreur de serveur.

403 est renvoyé lorsque les informations d’identification fournies ne sont pas correctes et que l’accès à la page ne peut pas être accordé.

Quoi Documents Google Etat:

“Googlebot ne fournit jamais d’informations d’identification, donc votre serveur renvoie cette erreur de manière incorrecte. Cette erreur doit être corrigée ou la page doit être bloquée par robots.txt ou noindex ».

Que pouvez-vous apprendre des pages exclues ?

Des pics soudains et énormes dans un groupe spécifique de pages exclues peuvent indiquer de graves problèmes avec votre site.

Voici trois exemples de pics qui peuvent indiquer de graves problèmes avec votre site Web :

  • Une forte augmentation du nombre de pages introuvables (404) peut indiquer un échec de la migration où les URL ont été modifiées, mais aucune redirection vers de nouvelles adresses n’a été implémentée. Cela peut également se produire après, par exemple, qu’une personne inexpérimentée modifie le slug des articles de blog et, par conséquent, modifie les URL de tous les blogs.
  • Une forte augmentation des découvertes – actuellement non indexées ou suivies – actuellement non indexé peut indiquer que votre site a été piraté. Assurez-vous de consulter les exemples de pages pour vérifier s’il s’agit bien de vos pages ou si elles ont été créées à la suite d’un piratage (c’est-à-dire des pages contenant des caractères chinois).
  • Une forte augmentation de la balise Exclus par ‘noindex’ peut également indiquer un échec du lancement et de la migration. Cela se produit souvent lorsqu’un nouveau site entre en production avec des balises “noindex” du site de test.

résumé

Vous pouvez en apprendre beaucoup sur votre site Web et sur la manière dont Googlebot interagit avec lui, grâce à la section Exclus du rapport de couverture GSC.

Que vous soyez nouveau dans le domaine du référencement ou que vous ayez déjà quelques années d’expérience, prenez l’habitude de consulter Google Search Console au quotidien.

Cela peut vous aider à repérer divers problèmes de référencement avant qu’ils ne deviennent de véritables catastrophes.

Davantage de ressources:


Image en vedette : Milan1983/Shutterstock





Cet article a été traduit par searchenginejournal

Laisser un commentaire