Que sont les erreurs Soft 404 de Google (et comment les corriger)

Les soft 404 sont des erreurs assez courantes que Google lance parfois pour les pages Web, en particulier pour les sites plus importants. Ils sont également une erreur étrange parce que les soft 404 sont un hybride de 404 et de pages normales, et ce qui cause exactement cette erreur pour une page particulière pourrait ne pas toujours être clair.

Donc, dans ce post, je veux aider à clarifier une partie de la confusion autour de la raison pour laquelle les erreurs soft 404 se produisent, comment ils sont différents des erreurs 404 régulières, et comment vous pouvez corriger les problèmes de référencement qui les causent.

Qu’est-ce qu’une erreur soft 404 ?

Selon Google :

« Une erreur soft 404 signifie qu’une URL sur votre site renvoie une page indiquant à l’utilisateur que la page n’existe pas et également un code de niveau 200 (succès) au navigateur. »

En gros, vous avez une page sur votre site qui dit aux visiteurs qu’elle n’existe plus, mais en même temps, elle dit aux moteurs de recherche qu’elle existe.

Confondant, non ?

Dans certains cas, il peut s’agir d’une page sur votre site qui n’a pas beaucoup, voire pas du tout, de contenu. Par exemple, WordPress génère automatiquement une nouvelle URL lorsque vous créez une nouvelle balise pour votre site. Si vous avez créé une balise mais que vous n’avez pas encore publié d’articles utilisant cette balise, vous aurez une page vide sur votre site – et potentiellement un soft 404 sur les bras.

Alors, que se passe-t-il vraiment là ? Eh bien, ces pages minces sont super déroutantes pour Googlebot. Lorsqu’il parcourt votre site et qu’il tombe sur une page dont le serveur dit qu’elle existe mais dont le contenu suggère le contraire, il se dit  » eh bien, cette page n’offre aucune valeur aux utilisateurs, donc elle ne vaut pas la peine d’être indexée  » et lui donne une étiquette soft 404.

Il est également possible d’obtenir un soft 404 lorsqu’une page n’existe pas et que lorsqu’un utilisateur atterrit dessus après avoir cliqué dans les résultats de recherche, il est redirigé vers une page qui n’est pas pertinente pour le contexte de la recherche. Par exemple, l’utilisateur atterrit sur une page et est automatiquement redirigé vers la page d’accueil.

Les erreurs soft 404 sont-elles vraiment importantes ?

Lorsqu’une page Web renvoie une erreur soft 404, elle n’apparaîtra pas dans la recherche Google. Fondamentalement, Google désindexe les pages qui renvoient une erreur soft 404, ce qui peut à son tour avoir un impact sur votre référencement.

Regardons un exemple :

Disons que vous gérez une boutique en ligne vendant des chaises et que vous avez des problèmes avec une URL en particulier : https://chairsgalorestore.com/products/sale/blue-chair

Alors que votre serveur pourrait charger l’URL sans problème, renvoyant un code d’état 200 (OK) parce qu’il y a une vraie page à cette URL, le contenu de la page pourrait dire aux visiteurs : « Désolé, il n’y a pas de produits correspondant à votre recherche. »

En gros, la page affiche des résultats de recherche pour un produit qui n’existe pas parce qu’il n’est plus en vente ou a été épuisé.

Les sites de commerce électronique contiennent souvent des pages et du contenu générés dynamiquement qui peuvent renvoyer des erreurs 404 logicielles lorsque les lignes de produits sont épuisées ou ne sont plus disponibles. Images : Unsplash.

Ce n’est pas du tout utile pour les visiteurs du site. Après tout, lorsqu’ils cliquent sur votre page à partir de la recherche Google, ils recherchent des chaises bleues et s’attendent à trouver des chaises bleues, mais découvrent au contraire qu’il n’y a pas de chaises disponibles !

C’est pour cette raison que Google a créé l’étiquette d’erreur soft 404 – c’est une étiquette, pas un code de réponse HTTP officiel – pour traiter le contenu mince ou inexistant et s’assurer que seuls les résultats de qualité apparaissent dans la recherche.

Que se passe-t-il donc pour les pages qui obtiennent une soft 404 ? Google n’indexe pas ces pages.

Essentiellement, Google ne veut pas gaspiller ses ressources à essayer d’explorer des pages qui envoient des signaux contradictoires, qui n’existent plus ou qui n’offrent pas de contenu de valeur et de qualité. Il les supprime donc simplement de son index et se met à explorer les pages qui existent réellement.

Comment vérifier la présence d’erreurs 404 logicielles sur votre site

La façon la plus simple de vérifier la présence d’erreurs 404 logicielles est d’utiliser Google Search Console (anciennement Google Webmaster Tools). Connectez-vous à votre compte et sur l’écran principal, vous verrez un graphique pour la « Performance » de votre site (total des clics par jour) et en dessous se trouvera un graphique pour la « Couverture »

Si vous avez des pages avec des erreurs, y compris des erreurs soft 404, elles seront affichées dans le graphique « Couverture ». Cliquez sur « Ouvrir le rapport » pour plus de détails sur vos erreurs.

Sur l’écran du rapport, toutes les erreurs seront affichées comme un total dans la grande boîte rouge. Vous pouvez cliquer sur cette boîte d’erreur rouge pour en savoir plus sur toutes les erreurs sur votre site et quelle pourrait être la source de l’erreur.

Heureusement pour moi, comme vous pouvez le voir sur l’écran de la Search Console pour mon site Web, je n’ai pas d’erreurs à corriger. Cependant, c’est l’écran que vous visiteriez pour les trouver.

Alternativement, vous pouvez utiliser Fetch as Google pour vérifier si une URL particulière sur votre site renvoie le code d’état correct, y compris les erreurs 404 soft.

Vous pouvez utiliser cet outil pour voir si Googlebot peut accéder à l’URL, comment il rend la page, et si des ressources de la page (telles que des images ou des scripts) sont bloquées pour Googlebot.

Il simule un crawl et un exécutif de rendu tel que fait dans le processus normal de crawling et de rendu de Google, et est super utile pour déboguer les problèmes de crawl sur votre site.

Comment réparer les erreurs 404 molles

Si vous obtenez des 404 molles sur votre site pour des pages critiques, telles que des pages de produits, de catégories ou de génération de prospects, il est crucial que vous agissiez rapidement pour réparer ces erreurs et faire en sorte que ces pages soient indexées et de retour dans la recherche Google.

De même, si vous avez un grand nombre d’erreurs 404 logicielles par rapport au nombre total de pages de votre site, ce n’est pas une bonne image que vous envoyez à Google. Un trop grand nombre d’erreurs 404 logicielles peut conduire à une réduction du taux d’exploration de votre site, ce qui pourrait à son tour entraîner une baisse du classement et conduire à moins de pages indexées – un gros problème si vous avez des centaines ou des milliers de pages !

La façon dont vous allez corriger les erreurs 404 logicielles dépend de la cause. Mais de manière générale, vous devez vous assurer que l’URL renvoie le bon code de réponse pour correspondre au contenu réel de la page.

Voici quelques façons de corriger les erreurs 404 souples :

Si la page n’est plus disponible

Les pages qui n’existent plus doivent renvoyer un code de réponse 404 (non trouvé) ou 410 (disparu). L’un ou l’autre code indique à la fois aux navigateurs et aux moteurs de recherche que la page n’existe plus.

Cela peut être un gros problème pour les boutiques de commerce électronique et les blogs, surtout si l’on considère que les trois sources les plus courantes d’erreurs 404 molles comprennent :

  1. Pages de résultats de recherche vides
  2. Catégories de produits eCommerce vides
  3. Catégories de blog vides

Puisque ces pages sont souvent générées et peuplées dynamiquement par WordPress, renvoyer simplement un 404 dur n’est pas la meilleure option.

Ce que les propres directives de Google suggèrent, c’est qu’en plus de renvoyer un code de réponse 404, vous devriez également afficher une page 404 personnalisée qui fournit des informations utiles pour aider les visiteurs à naviguer sur votre site. Il peut s’agir d’une page énumérant vos pages, vos articles de blog ou vos produits les plus populaires.

La page 404 de Yoast est un excellent exemple de la façon dont les sites Web peuvent mieux servir les utilisateurs perdus. Leur page 404 étapes clairement l’utilisation à travers comment ils peuvent trouver ce qu’ils recherchent. Et lorsque vous faites défiler la page vers le bas, il y a des liens vers des articles récents.

Si la page a été déplacée

Si vous avez changé l’URL d’une page (par exemple, mis à jour le slug d’un article de blog), il devrait retourner une 301 (redirection permanente) et rediriger les utilisateurs vers la nouvelle URL.

Alternativement, si la page s’est déplacée parce que vous avez mis à jour un ancien contenu, vous devriez rediriger l’URL vers une autre page de votre site contenant des informations actualisées ou plus pertinentes.

L’un de mes outils préférés pour configurer les redirections de pages est le plugin Redirection bien nommé. Alternativement, la version premium de Yoast SEO propose un gestionnaire de redirections.

Si la page est disponible

Si une page de votre site est disponible et devrait s’afficher dans les résultats de recherche, cela signifie que Googlebot la considère comme un contenu « mince ». Dans ce cas, vous devez travailler à l’amélioration du contenu de votre page afin d’éviter de déclencher une erreur 404 soft.

Ceci signifie qu’il faut s’assurer que lorsqu’un utilisateur clique sur votre page à partir des résultats de recherche, votre page fournit ce qu’il attend. Par exemple, pour reprendre mon exemple précédent sur l’achat de chaises bleues, vous voulez vous assurer que la page contient des informations sur les chaises bleues qui sont informatives et utiles pour l’utilisateur.

Si la page est disponible mais que vous ne voulez pas qu’elle apparaisse dans la recherche Google

Il se peut que certaines pages de votre site obtiennent des erreurs soft 404 que vous préféreriez supprimer complètement de l’index de Google. Par exemple, vous pouvez avoir des pages de balises, de catégories ou de résultats de recherche sur votre site WordPress qui continuent à obtenir des erreurs 404 logicielles et vous n’obtenez pas beaucoup de jus de référencement pour ces pages de toute façon.

Dans ce cas, vous devrez dire à Google de ne pas explorer ces pages. Vous pouvez le faire en ajoutant des règles disallow dans le fichier robots.text de votre site.

Pour les pages de recherche, par exemple, vous pourriez ajouter les lignes suivantes à votre fichier robots.txt:
Disallow: /?s=
Disallow: /search/

Alternativement, vous pourriez simplement noindexer les pages que vous ne voulez pas voir apparaître dans les résultats de recherche. La façon la plus simple de le faire est d’utiliser le plugin Yoast SEO. Par défaut, Yoast règle les pages de recherche et les pages 404 sur noindex, follow. Mais pour les pages de balises et de catégories, vous pouvez ajouter des règles noindex dans l’onglet « Apparence de recherche ».

Pour en savoir plus sur la façon de noindexer les URL, consultez ce guide de noindexation sur Yoast.

Conclusion

Les soft 404 sont des erreurs étranges et leur cause n’est pas toujours claire. Mais en creusant un peu, notamment dans Google Search Console, vous pouvez arriver à la racine du problème et mettre rapidement en œuvre une solution.

Pour les sites WordPress en particulier, qui ont presque toujours des pages générées dynamiquement qui lancent des erreurs soft 404, il suffit de noindexer ces pages dans les paramètres de Yoast. C’est aussi une bonne idée d’avoir une 404 personnalisée en place pour attraper les utilisateurs qui atterrissent sur des pages qui n’existent pas afin que vous puissiez les diriger vers les pages importantes de votre site.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.