Cosa sono gli errori Soft 404 di Google (e come risolverli)

I Soft 404 sono errori abbastanza comuni che Google a volte lancia per le pagine web, in particolare per i siti più grandi. Sono anche un errore strano perché i soft 404 sono un ibrido tra 404 e pagine normali, e ciò che esattamente sta causando questo errore per una particolare pagina potrebbe non essere sempre chiaro.

Quindi in questo post, voglio aiutare a chiarire un po’ di confusione sul perché gli errori soft 404 accadono, come sono diversi dagli errori 404 regolari, e come è possibile risolvere i problemi SEO che li causano.

Che cos’è un errore soft 404?

Secondo Google:

“Un soft 404 significa che un URL sul tuo sito restituisce una pagina che dice all’utente che la pagina non esiste e anche un codice di livello 200 (successo) al browser.”

In pratica, hai una pagina sul tuo sito che dice ai visitatori che non esiste più, ma allo stesso tempo, sta dicendo ai motori di ricerca che esiste.

Confusione, giusto?

In alcuni casi, potrebbe essere una pagina sul tuo sito che non ha molto, se non nessun, contenuto. Per esempio, WordPress genera automaticamente un nuovo URL quando si crea un nuovo tag per il tuo sito. Se avete creato un tag ma non avete ancora pubblicato alcun post utilizzando il tag, avrete una pagina vuota sul vostro sito e potenzialmente un soft 404 tra le mani.

Quindi cosa sta realmente succedendo? Beh, queste pagine sottili sono super confuse per Googlebot. Quando sta scansionando il tuo sito e si imbatte in una pagina che il server dice che esiste, ma il contenuto suggerisce il contrario, pensa “beh, questa pagina non offre alcun valore agli utenti, quindi non vale la pena indicizzarla” e le dà un’etichetta soft 404.

È anche possibile ottenere un soft 404 quando una pagina non esiste e quando un utente vi atterra dopo aver fatto clic nei risultati di ricerca, viene reindirizzato a una pagina che non è rilevante per il contesto di ricerca. Per esempio, l’utente arriva su una pagina e viene automaticamente reindirizzato alla home page.

Gli errori soft 404 contano davvero?

Quando una pagina web restituisce un errore soft 404, non apparirà nella ricerca di Google. Fondamentalmente, Google deindicizza le pagine che restituiscono un errore soft 404, che a sua volta può avere un impatto sul tuo SEO.

Diamo un’occhiata a un esempio:

Diciamo che gestisci un negozio online che vende sedie e stai avendo problemi con un URL in particolare: https://chairsgalorestore.com/products/sale/blue-chair

Mentre il tuo server potrebbe caricare l’URL senza problemi, restituendo un codice di stato 200 (OK) perché c’è una vera pagina a quell’URL, il contenuto della pagina potrebbe dire ai visitatori: “

Fondamentalmente, la pagina sta visualizzando i risultati della ricerca per un prodotto che non esiste perché non è più in vendita o è esaurito.

I siti di e-commerce spesso contengono pagine e contenuti generati dinamicamente che possono generare errori soft 404 quando le linee di prodotti si esauriscono o non sono più disponibili. Immagini: Unsplash.

Questo non è affatto utile per i visitatori del sito. Dopo tutto, quando cliccano sulla tua pagina dalla ricerca di Google, stanno cercando sedie blu e si aspettano di trovare sedie blu, ma invece scoprono che non ci sono sedie disponibili!

E’ per questo motivo che Google ha creato l’etichetta di errore soft 404 – è un’etichetta, non un codice di risposta HTTP ufficiale – per affrontare contenuti sottili o inesistenti e garantire che solo i risultati di qualità appaiano nella ricerca.

Quindi cosa succede alle pagine che ottengono un soft 404? Google non indicizza queste pagine.

In sostanza, Google non vuole sprecare le sue risorse cercando di scansionare le pagine che inviano segnali contrastanti, non esistono più o non offrono contenuti preziosi e di qualità. Quindi le rimuove semplicemente dal suo indice e continua a scansionare le pagine che esistono veramente.

Come controllare il tuo sito per gli errori soft 404

Il modo più semplice per controllare gli errori soft 404 è usare Google Search Console (ex Google Webmaster Tools). Accedi al tuo account e nella schermata principale vedrai un grafico per la “Performance” del tuo sito (click totali al giorno) e sotto ci sarà un grafico per la “Copertura”.

Se hai qualche pagina con errori, compresi gli errori soft 404, saranno visualizzati nel grafico “Copertura”. Clicca su “Apri rapporto” per maggiori dettagli sui tuoi errori.

Sulla schermata del rapporto, tutti gli errori saranno visualizzati come un totale nella grande scatola rossa. Puoi fare clic su questo riquadro rosso degli errori per saperne di più su qualsiasi errore sul tuo sito e quale potrebbe essere la fonte dell’errore.

Fortunatamente per me, come puoi vedere nella schermata Search Console per il mio sito web, non ho alcun errore da correggere. Tuttavia, questa è la schermata da visitare per trovarli.

In alternativa, è possibile utilizzare Fetch come Google per controllare se un particolare URL sul tuo sito sta restituendo il codice di stato corretto, compresi gli errori soft 404.

È possibile utilizzare questo strumento per vedere se Googlebot può accedere all’URL, come rende la pagina, e se le risorse della pagina (come immagini o script) sono bloccate a Googlebot.

Simula un crawl e un rendering esecutivo come fatto nel normale processo di crawling e rendering di Google, ed è super utile per risolvere i problemi di crawl sul tuo sito.

Come risolvere gli errori Soft 404

Se stai ricevendo soft 404 sul tuo sito per le pagine critiche, come le pagine dei prodotti, delle categorie o della generazione di lead, è fondamentale che tu agisca rapidamente per risolvere questi errori e ottenere queste pagine indicizzate e nuovamente nella ricerca di Google.

Parimenti, se avete un gran numero di errori soft 404 rispetto al numero totale di pagine del vostro sito, non è un buon aspetto che state inviando a Google. Troppi errori soft 404 possono portare a un tasso di scansione ridotto del vostro sito, che a sua volta potrebbe risultare in un ranking più basso e portare a un minor numero di pagine indicizzate – un grosso problema se avete centinaia o migliaia di pagine!

Il modo in cui si procede alla correzione degli errori soft 404 dipende dalla causa. Ma in generale, dovresti assicurarti che l’URL restituisca il giusto codice di risposta che corrisponda al contenuto effettivo della pagina.

Ecco alcuni modi per risolvere gli errori soft 404:

Se la pagina non è più disponibile

Le pagine che non esistono più dovrebbero restituire un codice di risposta 404 (non trovato) o 410 (andato). Entrambi i codici dicono sia ai browser che ai motori di ricerca che la pagina non esiste più.

Questo può essere un grosso problema per i negozi di eCommerce e i blog, soprattutto se si considera che le tre fonti più comuni di errori 404 soft includono:

  1. Pagine di risultati di ricerca vuote
  2. Categorie di prodotti eCommerce vuote
  3. Categorie di blog vuote

Siccome queste pagine sono spesso generate e popolate dinamicamente da WordPress, la semplice restituzione di un 404 non è la migliore opzione.

Quello che le linee guida di Google suggeriscono è che oltre a restituire un codice di risposta 404, si dovrebbe anche visualizzare una pagina 404 personalizzata che fornisce informazioni utili per aiutare i visitatori a navigare nel vostro sito. Questa potrebbe essere una pagina che elenca le tue pagine più popolari, i post del blog o i prodotti.

La pagina 404 di Yoast è un grande esempio di come i siti web possono servire meglio gli utenti persi. La loro pagina 404 indica chiaramente all’utente come trovare ciò che sta cercando. E quando si scorre la pagina verso il basso ci sono dei link ai post recenti.

Se la pagina si è spostata

Se hai cambiato l’URL di una pagina (ad esempio hai aggiornato lo slug di un post del blog) dovrebbe restituire un 301 (redirect permanente) e reindirizzare gli utenti al nuovo URL.

In alternativa, se la pagina si è spostata perché hai aggiornato il vecchio contenuto, dovresti reindirizzare l’URL a un’altra pagina del tuo sito che contiene informazioni aggiornate o più rilevanti.

Uno dei miei strumenti preferiti per impostare i reindirizzamenti di pagina è il plugin Redirection, dal nome appropriato. In alternativa, la versione premium di Yoast SEO dispone di un redirect manager.

Se la pagina è disponibile

Se una pagina del tuo sito è disponibile e dovrebbe essere visualizzata nei risultati di ricerca, significa che Googlebot la vede come contenuto “sottile”. In questo caso, è necessario lavorare per migliorare il contenuto della pagina in modo da evitare di innescare un errore soft 404.

Questo significa garantire che quando un utente clicca sulla tua pagina dai risultati di ricerca, la tua pagina offre ciò che si aspetta. Per esempio, per usare il mio esempio precedente sullo shopping di sedie blu, vuoi assicurarti che la pagina contenga informazioni sulle sedie blu che siano informative e utili per l’utente.

Se la pagina è disponibile ma non vuoi che appaia nella ricerca di Google

Ci potrebbero essere pagine sul tuo sito che ricevono errori soft 404 che preferiresti rimuovere del tutto dall’indice di Google. Per esempio, potreste avere tag, categorie o pagine di risultati di ricerca sul vostro sito WordPress che continuano a ricevere soft 404 e non state comunque ottenendo molto succo SEO per queste pagine.

In questo caso, avrete bisogno di dire a Google di non scansionare queste pagine. Potete farlo aggiungendo regole di disconoscimento nel file robots.text del vostro sito.

Per le pagine di ricerca, ad esempio, potreste aggiungere le seguenti righe al vostro file robots.txt:
Disallow: /?s=
Disallow: /search/

In alternativa, potreste semplicemente noindexare le pagine che non volete appaiano nei risultati di ricerca. Il modo più semplice per farlo è usare il plugin Yoast SEO. Per impostazione predefinita, Yoast imposta le pagine di ricerca e le pagine 404 su noindex, follow. Ma per le pagine dei tag e delle categorie è possibile aggiungere regole di noindex nella scheda “Aspetto di ricerca”.

Per ulteriori informazioni su come noindexare gli URL, controlla questa guida al noindexing su Yoast.

Conclusione

I soft 404 sono strani errori e non è sempre chiaro cosa li sta causando. Ma con un po’ di ricerche, soprattutto in Google Search Console, è possibile arrivare alla radice del problema e implementare rapidamente una soluzione.

Per i siti WordPress in particolare, che hanno quasi sempre pagine generate dinamicamente che generano errori soft 404, basta noindicare queste pagine nelle impostazioni di Yoast. È anche una buona idea avere un 404 personalizzato in atto per catturare gli utenti che atterrano su pagine che non esistono, in modo da poterli indirizzare alle pagine importanti del tuo sito.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.