Soft 404s são erros bastante comuns que o Google às vezes vomita para páginas web, particularmente para sites maiores. Eles também são um erro estranho porque soft 404s são um híbrido de 404 e páginas normais, e o que exatamente está causando este erro para uma determinada página pode não estar sempre claro.
Então, neste post, eu quero ajudar a esclarecer algumas das confusões em torno de porque os erros soft 404 acontecem, como eles são diferentes dos erros regulares 404, e como você pode corrigir os problemas de SEO que os causam.
O que é um Erro Soft 404?
Segundo o Google:
“Um Soft 404 significa que um URL no seu site retorna uma página dizendo ao usuário que a página não existe e também um código de 200 níveis (sucesso) para o navegador.”
Basicamente, você tem uma página no seu site dizendo aos visitantes que ela não existe mais, mas ao mesmo tempo, está dizendo aos mecanismos de busca que ela existe.
Confusiva, certo?
Em alguns casos, pode ser uma página no seu site que não tem muito, se houver algum, conteúdo. Por exemplo, o WordPress gera automaticamente uma nova URL quando você cria uma nova tag para o seu site. Se você criou uma tag mas ainda não publicou nenhum post usando a tag, você terá uma página vazia em seu site – e potencialmente uma soft 404 em suas mãos.
Então o que está realmente acontecendo lá? Bem, estas páginas finas são super confusas para o Googlebot. Quando ela está rastreando seu site e se depara com uma página que o servidor diz existir, mas o conteúdo sugere o contrário, ele pensa, “bem, esta página não oferece nenhum valor aos usuários, então não vale a pena indexá-la” e lhe dá um rótulo soft 404.
Também é possível obter um soft 404 quando uma página não existe e quando um usuário aterrissa nela após clicar nos resultados de pesquisa, eles são redirecionados para uma página que não é relevante para o contexto de pesquisa. Por exemplo, o usuário aterrissa em uma página e é automaticamente redirecionado para a página inicial.
De fato importa os erros do Soft 404?
Quando uma página web retorna um erro do soft 404, ele não aparecerá na busca do Google. Basicamente, o Google desíndices páginas que retornam um erro soft 404, que por sua vez pode impactar o seu SEO.
Demos uma olhada em um exemplo:
Digamos que você executa uma loja online vendendo cadeiras e você está tendo problemas com uma URL em particular: https://chairsgalorestore.com/products/sale/blue-chair
Embora seu servidor possa carregar a URL sem problemas, retornando um código de status 200 (OK) porque há uma página real nessa URL, o conteúdo da página pode estar dizendo aos visitantes: “Desculpe, não há produtos que correspondam à sua pesquisa”
Basicamente, a página está mostrando resultados de pesquisa para um produto que não existe porque não está mais à venda ou esgotou.
Sites de comércio muitas vezes contêm páginas e conteúdo gerados dinamicamente que podem vomitar suavemente 404 erros quando as linhas de produtos se esgotam ou não estão mais disponíveis. Imagens: Unsplash.
Isto não é de todo útil para os visitantes do site. Afinal, quando eles clicam na sua página a partir da pesquisa do Google, estão à procura de cadeiras azuis e esperam encontrar cadeiras azuis, mas em vez disso descobrem que não há cadeiras disponíveis!
Foi por este motivo que o Google criou o rótulo de erro soft 404 – é um rótulo, não um código de resposta HTTP oficial – para lidar com conteúdo fino ou inexistente e garantir que apenas os resultados de qualidade aparecem na pesquisa.
Então o que acontece com as páginas que obtêm um soft 404? O Google não indexa essas páginas.
Essencialmente, o Google não quer desperdiçar seus recursos tentando rastrear páginas que enviam sinais conflitantes, não existem mais, ou não oferecem conteúdo valioso e de qualidade. Por isso, simplesmente remove-os do seu índice e continua com as páginas que realmente existem.
Como verificar se o seu site contém erros Soft 404
A forma mais fácil de verificar se existem erros Soft 404 é utilizando a Consola de Pesquisa do Google (anteriormente Google Webmaster Tools). Entre na sua conta e no ecrã principal verá um gráfico para o “Desempenho” do seu site (total de cliques por dia) e por baixo estará um gráfico para “Cobertura”
Se tiver alguma página com erros, incluindo erros do soft 404, eles serão mostrados no gráfico “Cobertura”. Clique em “Open Report” para mais detalhes sobre seus erros.
Na tela do relatório, qualquer erro será exibido como um total na caixa grande, vermelha. Você pode clicar nesta caixa vermelha de erro para saber mais sobre qualquer erro em seu site e qual a origem do erro.
Felizmente para mim, como você pode ver na tela do Console de Busca do meu site, eu não tenho nenhum erro que precise ser corrigido. No entanto, esta é a tela que você visitaria para encontrá-los.
Alternativamente, você pode usar Fetch como Google para verificar se uma URL em particular no seu site está retornando o código de status correto, incluindo erros do soft 404.
Você pode usar esta ferramenta para ver se o Googlebot pode acessar a URL, como ela renderiza a página e se algum recurso da página (como imagens ou scripts) está bloqueado no Googlebot.
Simula um rastejamento e renderização executiva como feito no processo normal de rastejamento e renderização do Google, e é super útil para depuração de problemas de rastejamento no seu site.
Como corrigir erros Soft 404
Se você está obtendo soft 404s no seu site para páginas críticas, como produto, categoria ou páginas de geração de leads, é crucial que você aja rapidamente para corrigir esses erros e obter essas páginas indexadas e de volta na pesquisa do Google.
Likewise, se você tiver um grande número de erros soft 404 em relação ao número total de páginas do seu site, esta não é uma boa aparência que você está enviando ao Google. Demasiados erros soft 404 podem levar a uma taxa reduzida de rastejamento do seu site, o que, por sua vez, pode resultar em classificações mais baixas e levar a menos páginas indexadas – um grande problema se tiver centenas ou milhares de páginas!
Como corrigir erros soft 404 depende da causa. Mas de um modo geral, deve assegurar-se de que a URL retorna o código de resposta correcto para corresponder ao conteúdo real da página.
Aqui estão algumas formas de corrigir os erros do soft 404:
Se a página já não estiver disponível
Páginas que já não existem devem retornar um código de resposta 404 (não encontrado) ou 410 (desaparecido). Qualquer um dos códigos diz aos navegadores e motores de busca que a página já não existe.
Este pode ser um grande problema para lojas e blogs de eCommerce, especialmente quando você considera as três fontes mais comuns de erros soft 404 incluem:
- Páginas de resultados de pesquisa
- Categorias de produtos de eCommerce
- Categorias de blogs
Desde que estas páginas são muitas vezes geradas dinamicamente e povoadas pelo WordPress, simplesmente retornar um 404 rígido não é a melhor opção.
O que as próprias diretrizes do Google sugerem é que, além de retornar um código de resposta 404, você também deve exibir uma página 404 personalizada que fornece informações úteis para ajudar os visitantes a navegar no seu site. Esta pode ser uma página listando suas páginas mais populares, posts em blogs ou produtos.
A página 404 do Google é um ótimo exemplo de como o site pode servir melhor aos usuários perdidos. A página 404 deles é um exemplo claro de como eles podem encontrar o que eles estão procurando. E quando você rolar a página para baixo há links para posts recentes.
Se a página se moveu
Se você mudou a URL de uma página (por exemplo, atualizou a lesma para um post de blog), ela deve retornar um 301 (redirecionamento permanente) e redirecionar os usuários para a nova URL.
Alternativamente, se a página foi movida porque você atualizou conteúdo antigo, você deve redirecionar a URL para outra página do seu site contendo informações atualizadas ou mais relevantes.
Uma das minhas ferramentas favoritas para configurar redirecionamentos de página é o plugin Redirecionamento, apropriadamente chamado de Redirecionamento. Alternativamente, a versão premium do Yoast SEO possui um gerenciador de redirecionamento.
Se a página estiver disponível
Se uma página do seu site estiver disponível e deve ser exibida nos resultados de pesquisa, isso significa que o Googlebot a vê como um conteúdo “fino”. Nesse caso, você precisa trabalhar para melhorar o conteúdo da sua página para evitar acionar um erro suave 404.
Isso significa garantir que, quando um usuário clicar na sua página a partir dos resultados de pesquisa, a sua página forneça o que ele está esperando. Por exemplo, para usar meu exemplo anterior sobre compras de cadeiras azuis, você quer ter certeza de que a página contém informações sobre cadeiras azuis que são informativas e úteis para o usuário.
Se a página estiver disponível mas você não quiser que ela apareça na pesquisa do Google
Pode haver páginas no seu site recebendo erros do soft 404 que você prefere remover do índice do Google por completo. Por exemplo, você pode ter páginas de tag, categoria ou resultados de pesquisa no seu site WordPress que continuam a ter soft 404s e você não está recebendo muito sumo de SEO para essas páginas de qualquer maneira.
Neste caso, você precisará dizer ao Google para não rastrear essas páginas. Você pode fazer isso adicionando regras de rejeição no arquivo robots.text do seu site.
Para páginas de busca, por exemplo, você poderia adicionar as seguintes linhas ao seu arquivo robots.txt:Disallow: /?s=
Disallow: /search/
Alternativamente, você poderia simplesmente não indexar páginas que você não quer que apareçam nos resultados de busca. A maneira mais fácil de fazer isso é usando o plugin Yoast SEO. Por padrão, Yoast define páginas de pesquisa e 404 páginas para noindex, siga. Mas para páginas tag e categoria você pode adicionar regras de noindex na aba “Search Appearance”.
Para saber mais sobre como noindexar URLs, confira este guia para noindexing over no Yoast.
Conclusion
Soft 404s são erros estranhos e nem sempre é claro o que os está causando. Mas, com um pouco de pesquisa, especialmente no Google Search Console, você pode chegar à raiz do problema e rapidamente implementar uma solução.
Para sites WordPress em particular, que quase sempre têm páginas geradas dinamicamente que vomitam erros soft 404, simplesmente noindexar essas páginas nas configurações do Yoast. É também uma boa idéia ter um 404 personalizado para pegar usuários que pousam em páginas que não existem para que você possa direcioná-las para as páginas importantes do seu site.