Qué son los errores soft 404 de Google (y cómo solucionarlos)

Los soft 404 son errores bastante comunes que Google arroja a veces para las páginas web, especialmente para los sitios más grandes. También son un error extraño porque los 404 suaves son un híbrido entre las páginas 404 y las normales, y lo que está causando exactamente este error para una página en particular puede no estar siempre claro.

Así que en este post, quiero ayudar a aclarar algo de la confusión en torno a por qué ocurren los errores 404 suaves, cómo son diferentes de los errores 404 regulares, y cómo se puede arreglar los problemas de SEO que los causan.

¿Qué es un error 404 suave?

Según Google:

«Un soft 404 significa que una URL de su sitio devuelve una página que indica al usuario que la página no existe y también un código de nivel 200 (éxito) al navegador.»

Básicamente, tienes una página en tu sitio diciéndole a los visitantes que ya no existe, pero al mismo tiempo, le está diciendo a los motores de búsqueda que sí existe.

Confuso, ¿verdad?

En algunos casos, podría ser una página en tu sitio que no tiene mucho, o ningún contenido. Por ejemplo, WordPress genera automáticamente una nueva URL cuando se crea una nueva etiqueta para su sitio. Si ha creado una etiqueta pero aún no ha publicado ninguna entrada utilizando la etiqueta, tendrá una página vacía en su sitio y potencialmente un soft 404 en sus manos.

¿Así que qué está sucediendo realmente allí? Bueno, estas páginas delgadas son súper confusas para Googlebot. Cuando está rastreando su sitio y se encuentra con una página que el servidor dice que existe, pero el contenido sugiere lo contrario, piensa «bueno, esta página no ofrece ningún valor a los usuarios, así que no vale la pena indexarla» y le da una etiqueta soft 404.

También es posible obtener un soft 404 cuando una página no existe y cuando un usuario aterriza en ella después de hacer clic en los resultados de búsqueda, es redirigido a una página que no es relevante para el contexto de búsqueda. Por ejemplo, el usuario entra en una página y es redirigido automáticamente a la página de inicio.

¿Los errores soft 404 son realmente importantes?

Cuando una página web devuelve un error soft 404, no aparecerá en la búsqueda de Google. Básicamente, Google desindexa las páginas que devuelven un error 404 suave, lo que a su vez puede afectar a su SEO.

Veamos un ejemplo:

Digamos que tiene una tienda online de venta de sillas y tiene problemas con una URL en particular: https://chairsgalorestore.com/products/sale/blue-chair

Aunque su servidor puede cargar la URL sin problemas, devolviendo un código de estado 200 (OK) porque hay una página real en esa URL, el contenido de la página podría estar diciendo a los visitantes: «Lo sentimos, no hay productos que coincidan con su búsqueda»

Básicamente, la página está mostrando los resultados de la búsqueda de un producto que no existe porque ya no está a la venta o se ha agotado.

Los sitios de comercio electrónico a menudo contienen páginas y contenidos generados dinámicamente que pueden arrojar errores soft 404 cuando las líneas de productos se agotan o ya no están disponibles. Imágenes: Unsplash.

Esto no es en absoluto útil para los visitantes del sitio. Después de todo, cuando hacen clic en su página desde la búsqueda de Google, están buscando sillas azules y esperan encontrar sillas azules, pero en su lugar descubren que no hay ninguna silla disponible.

Por esta razón, Google creó la etiqueta de error 404 suave -es una etiqueta, no un código de respuesta HTTP oficial- para tratar el contenido escaso o inexistente y garantizar que sólo aparezcan resultados de calidad en la búsqueda.

¿Qué ocurre con las páginas que obtienen un 404 suave? Google no indexa estas páginas.

Esencialmente, Google no quiere malgastar sus recursos intentando rastrear páginas que envían señales contradictorias, que ya no existen o que no ofrecen contenido valioso y de calidad. Por lo tanto, simplemente las elimina de su índice y se dedica a rastrear las páginas que realmente existen.

Cómo comprobar si su sitio presenta errores blandos 404

La forma más sencilla de comprobar si existen errores blandos 404 es utilizar Google Search Console (anteriormente, Google Webmaster Tools). Acceda a su cuenta y, en la pantalla principal, verá un gráfico de «Rendimiento» de su sitio (total de clics por día) y, debajo, un gráfico de «Cobertura».

Si tiene alguna página con errores, incluidos los errores 404 blandos, se mostrará en el gráfico de «Cobertura». Haga clic en «Abrir informe» para obtener más detalles sobre sus errores.

En la pantalla del informe, cualquier error se mostrará como un total en el cuadro grande y rojo. Puede hacer clic en este cuadro rojo de error para obtener más información sobre cualquier error en su sitio y cuál podría ser el origen del error.

Afortunadamente para mí, como puede ver en la pantalla de Search Console para mi sitio web, no tengo ningún error que necesite ser corregido. Sin embargo, esta es la pantalla que visitaría para encontrarlos.

Alternativamente, puede utilizar Fetch as Google para comprobar si una URL concreta de su sitio devuelve el código de estado correcto, incluidos los errores 404 suaves.

Puede utilizar esta herramienta para ver si Googlebot puede acceder a la URL, cómo renderiza la página y si algún recurso de la página (como las imágenes o los scripts) está bloqueado para Googlebot.

Simula una ejecución de rastreo y renderización como la que se realiza en el proceso normal de rastreo y renderización de Google, y es muy útil para depurar problemas de rastreo en su sitio.

Cómo solucionar los errores 404 suaves

Si está recibiendo errores 404 suaves en su sitio para páginas críticas, como páginas de productos, de categorías o de generación de clientes potenciales, es crucial que actúe rápidamente para solucionar estos errores y conseguir que estas páginas se indexen y vuelvan a aparecer en la búsqueda de Google.

Del mismo modo, si tiene un gran número de errores soft 404 en relación con el número total de páginas de su sitio, no es una buena imagen la que está enviando a Google. Un número excesivo de errores soft 404 puede provocar una reducción de la tasa de rastreo de su sitio, lo que a su vez podría dar lugar a una clasificación más baja y a un menor número de páginas indexadas, un gran problema si tiene cientos o miles de páginas. Pero, en general, debe asegurarse de que la URL devuelva el código de respuesta correcto para que coincida con el contenido real de la página.

Aquí tiene algunas formas de arreglar los errores soft 404:

Si la página ya no está disponible

Las páginas que ya no existen deben devolver un código de respuesta 404 (no encontrado) o 410 (desaparecido). Cualquiera de los dos códigos indica tanto a los navegadores como a los motores de búsqueda que la página ya no existe.

Esto puede ser un gran problema para las tiendas de comercio electrónico y los blogs, especialmente si se tiene en cuenta que las tres fuentes más comunes de errores 404 suaves incluyen:

  1. Páginas de resultados de búsqueda vacías
  2. Categorías de productos de eCommerce vacías
  3. Categorías de blog vacías

Dado que estas páginas a menudo son generadas y pobladas dinámicamente por WordPress, simplemente devolver un 404 duro no es la mejor opción.

Las propias directrices de Google sugieren que, además de devolver un código de respuesta 404, se muestre una página 404 personalizada que proporcione información útil para ayudar a los visitantes a navegar por el sitio. Puede tratarse de una página que enumere las páginas más populares, las publicaciones del blog o los productos.

La página 404 de Yoast es un gran ejemplo de cómo los sitios web pueden prestar un mejor servicio a los usuarios perdidos. Su página 404 explica claramente al usuario cómo puede encontrar lo que está buscando. Y cuando te desplazas hacia abajo en la página hay enlaces a las publicaciones recientes.

Si la página se ha movido

Si has cambiado la URL de una página (por ejemplo, has actualizado el slug de una publicación del blog) debería devolver una 301 (redirección permanente) y redirigir a los usuarios a la nueva URL.

Alternativamente, si la página se ha movido porque has actualizado el contenido antiguo, deberías redirigir la URL a otra página de tu sitio que contenga información actualizada o más relevante.

Una de mis herramientas favoritas para configurar redireccionamientos de páginas es el plugin Redirection, de nombre acertado. Alternativamente, la versión premium de Yoast SEO cuenta con un gestor de redirecciones.

Si la página está disponible

Si una página de tu sitio está disponible y debería aparecer en los resultados de búsqueda, significa que Googlebot la ve como contenido «fino». En este caso, debe trabajar en la mejora del contenido de su página para evitar que se produzca un error 404 suave.

Esto significa asegurarse de que cuando un usuario hace clic en su página desde los resultados de búsqueda, su página ofrece lo que espera. Por ejemplo, utilizando mi ejemplo anterior sobre la compra de sillas azules, debe asegurarse de que la página contenga información sobre las sillas azules que sea útil para el usuario.

Si la página está disponible, pero no desea que aparezca en la búsqueda de Google

Puede haber páginas de su sitio que reciban errores 404 blandos y que prefiera eliminar por completo del índice de Google. Por ejemplo, es posible que haya páginas de etiquetas, de categorías o de resultados de búsqueda en su sitio de WordPress que sigan obteniendo errores 404 suaves y que, de todos modos, no esté obteniendo mucho rendimiento SEO de estas páginas.

En este caso, deberá indicar a Google que no rastree estas páginas. Puede hacerlo añadiendo reglas de rechazo en el archivo robots.text de su sitio.

Para las páginas de búsqueda, por ejemplo, puede añadir las siguientes líneas a su archivo robots.txt:
Disallow: /?s=
Disallow: /search/

Alternativamente, puede simplemente noindexar las páginas que no desea que aparezcan en los resultados de búsqueda. La forma más fácil de hacer esto es usando el plugin Yoast SEO. Por defecto, Yoast establece las páginas de búsqueda y las páginas 404 como noindex, follow. Pero para las páginas de etiquetas y categorías puedes añadir reglas de noindexación en la pestaña «Apariencia de búsqueda».

Para saber más sobre cómo noindexar URLs, echa un vistazo a esta guía de noindexación en Yoast.

Conclusión

Los 404 suaves son errores extraños y no siempre está claro qué los causa. Pero con un poco de investigación, especialmente en Google Search Console, se puede llegar a la raíz del problema e implementar rápidamente una solución.

Para los sitios de WordPress en particular, que casi siempre tienen páginas generadas dinámicamente que arrojan errores 404 suaves, simplemente noindex estas páginas en la configuración de Yoast. También es una buena idea tener un 404 personalizado en su lugar para atrapar a los usuarios que aterrizan en las páginas que no existen para que pueda dirigirlos a las páginas importantes de su sitio.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.