SEO e realizzazione siti web Udine a misura di PMI

menu x
menu x

Errore 404 VS Soft 404: le differenze tra i due errori e come correggerli

  • 15 Febbraio 2021
Laura Musig Siti web Udine » Blog SEO » Errore 404 VS Soft 404: le differenze tra i due errori e come correggerli
Si parla di:
errore-404-errore-soft-404
Ogni pagina che viene caricata in un browser web ha un codice di stato incluso nelle intestazioni HTTP, che può essere visibile o meno sulla pagina web stessa. Ci sono molti tipi codici di risposta che un server fornisce per comunicare lo stato di caricamento della pagina; uno dei codici più noti è il codice a risposta 404.

In genere, qualsiasi codice compreso tra 400 e 499 indica che la pagina non è stata caricata. Il codice 404 è l’unico che ha un significato specifico: che la pagina è effettivamente scomparsa e probabilmente non tornerà presto.

Che cos’è un errore soft 404?

Un errore soft 404 non è un codice di risposta ufficiale inviato a un browser web. È solo un’etichetta che Google aggiunge a una pagina all’interno del proprio indice. Poiché Google esegue la scansione delle pagine, alloca le risorse con attenzione assicurando che non venga perso tempo per la scansione delle pagine mancanti che non devono essere indicizzate (al fino di una migliore gestione del crawl budget). Tuttavia, alcuni server sono configurati male e la loro pagina mancante carica un codice 200 quando dovrebbe visualizzare un codice di risposta 404. Se l’intestazione HTTP invisibile mostra un codice 200 anche se la pagina web indica chiaramente che la pagina non è stata trovata, la pagina potrebbe essere indicizzata, il che è uno spreco di risorse per Google.

Per contrastare questo problema, Google rileva le caratteristiche delle pagine 404 e tenta di discernere se la pagina 404 è davvero una pagina 404. In altre parole, Google ha imparato che se sembra un 404, “puzza di” 404 e si comporta come un 404, allora è probabilmente una vera pagina 404.

Errori indicati erroneamente come Soft 404

Ci sono anche casi in cui la pagina non è effettivamente mancante, ma alcune caratteristiche hanno spinto Google a classificarla come pagina mancante. Alcune di queste caratteristiche includono una piccola quantità o mancanza di contenuto sulla pagina e troppe pagine simili sul sito.

Queste caratteristiche sono anche simili ai fattori che l’algoritmo Panda affronta. L’aggiornamento Panda considera il thin content e duplicato come fattori di ranking negativi. Pertanto, la risoluzione di questi problemi aiuterà a evitare sia i problemi soft 404 che i problemi connessi a Panda.

Gli errori 404 hanno due cause principali:

  • un errore nel collegamento, che indirizza gli utenti a una pagina che non esiste.
  • un collegamento a una pagina che esisteva e che è improvvisamente scomparsa.

Errore nei link

Se la causa del 404 è un errore di collegamento (link), è sufficiente correggere i collegamenti. La parte difficile di questo compito è trovare tutti i collegamenti interrotti su un sito. Può essere più impegnativo per siti grandi e complessi con migliaia o milioni di pagine. In casi come questo, gli strumenti di scansione sono utili. Puoi provare a utilizzare software come Xenu, DeepCrawl, Screaming Frog o Botify.

Una pagina che non esiste più

Quando una pagina non esiste più, sono disponibili due opzioni:

  • Ripristina la pagina se è stata rimossa accidentalmente.
  • Se la pagina è stata rimossa di proposito impostare l’opportuno redirect 301 verso la pagina correlata migliore.

Innanzitutto, devi individuare tutti gli errori di collegamento sul sito. Simile alla ricerca di tutti gli errori nel collegamento a un sito web su larga scala, è possibile utilizzare i crawling tools menzionati sopra Tuttavia, gli strumenti di scansione potrebbero non trovare pagine orfane, che sono pagine non collegate da nessuna parte all’interno dei menu di navigazione o da nessuna delle pagine.

Le pagine orfane possono esistere in quanto facevano parte del sito web, quindi dopo una riprogettazione del sito web, il link a questa vecchia pagina è scomparso, ma è possibile che i collegamenti esterni da altri siti web rimandino a loro.

Per ricontrollare se questi tipi di pagine esistono sul tuo sito, puoi utilizzare una varietà di strumenti. La console di ricerca di Google Search Console segnalerà 404 pagine mentre il crawler di Google esamina tutte le pagine che riesce a trovare. Questo può includere collegamenti da altri siti che vanno a una pagina che esisteva sul tuo sito web.

Google Analytics

Non troverai un rapporto sulla pagina mancante in Google Analytics per impostazione predefinita. Tuttavia, puoi rintracciarli in diversi modi. Per prima cosa, puoi creare un rapporto personalizzato e segmentare le pagine che hanno un titolo di pagina che menziona l’errore 404 – Pagina non trovata. Un altro modo per trovare pagine orfane in Google Analytics consiste nel creare raggruppamenti di contenuti personalizzati e assegnare tutte le 404 pagine a un gruppo di contenuti.

Site: operatore di ricerca Google

La ricerca di “site: miosito.com” su Google elenca tutte le pagine di miosito.com indicizzate da Google. Puoi quindi controllare individualmente se le pagine si stanno caricando o se stanno dando un 404. Per fare questo su larga scala, puoi usare WebCEO, che ha una funzionalità per avviare una scansione con l’operatore site: non solo su Google, ma anche su Bing, Yahoo, Yandex, Naver, Baidu e Seznam. Poiché tutti i motori di ricerca ti forniranno solo un sottoinsieme, eseguirlo su più motori di ricerca può aiutarti a fornire un elenco più ampio di pagine del tuo sito. Questo elenco può essere esportato ed eseguito su strumenti per un controllo 404 di massa. È possibile farlo aggiungendo tutti gli URL come collegamenti all’interno di un file HTML e quindi caricarlo su Xenu per controllare in modo massivo la presenza di errori 404.

Altri strumenti di ricerca sui backlink

Anche strumenti di ricerca sui backlink come Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, LinkResearchTools e CognitiveSEO possono aiutare. La maggior parte di questi strumenti esporterà un elenco di collegamenti a ritroso che collegano al tuo dominio. Da lì, puoi controllare tutte le pagine a cui sono stati collegati e cercare errori 404.

Come correggere gli errori soft 404

Gli strumenti di scansione non rilevano un soft 404 perché non è realmente un errore 404. Ma puoi utilizzare gli strumenti di scansione per rilevare qualcos’altro. Ecco alcune cose da trovare:

  • Thin Content: alcuni strumenti di scansione non solo segnalano le pagine con contenuto scarso, ma mostrano anche un conteggio totale delle parole. Da lì, puoi ordinare gli URL in base al numero di parole dei tuoi contenuti. Inizia con le pagine che contengono il minor numero di parole e valuta se la pagina ha un contenuto scarso.
  • Contenuti duplicati: alcuni strumenti di scansione sono sufficientemente sofisticati per distinguere quale percentuale della pagina è il contenuto originale. Se il contenuto principale è quasi lo stesso di molte altre pagine, dovresti esaminare queste pagine e determinare il motivo per cui esistono contenuti duplicati sul tuo sito.

Oltre agli strumenti di scansione, puoi anche utilizzare Google Search Console e controllare gli errori di scansione per trovare le pagine elencate alla sezione 404 soft. La scansione di un intero sito per trovare problemi che causano errori soft 404 consente di individuare e correggere i problemi prima ancora che Google li rilevi. Dopo aver rilevato questi problemi soft 404, sarà necessario correggerli. Il più delle volte, le soluzioni sembrano essere il buon senso. Ciò può includere cose semplici come espandere pagine con contenuto scarso o sostituire contenuti duplicati con contenuti nuovi e unici. Durante questo processo, ecco alcune cose da considerare:

  • Consolida le pagine: a volte il thin content è causato dall’essere troppo specifico rispetto all’argomento della pagina, il che può lasciare poco da dire. Unire più pagine “thin” in una pagina può essere più appropriato se gli argomenti sono correlati. Questo non solo risolve i problemi di contenuto sottile, ma può anche risolvere i problemi di contenuto duplicato. Ad esempio, un sito di e-commerce che vende scarpe di diversi colori e taglie potrebbe avere un URL diverso per ogni combinazione di taglia e colore. Ciò lascia un gran numero di pagine con contenuti sottili e relativamente identici. L’approccio più efficace consiste invece nel mettere tutto su una pagina ed enumerare le opzioni disponibili.
  • Trova problemi tecnici che causano contenuti duplicati: utilizzando anche il più semplice strumento di scansione web come Xenu (che non guarda i contenuti ma solo URL, codici di risposta e tag del titolo), puoi comunque trovare problemi di contenuti duplicati guardando gli URL. Ciò include cose come URL www e non www, http e https, con index.html e senza, con parametri di tracciamento e senza, ecc.

Laura Musig SEO UdineLaura Musig

Web Designer e SEO Freelance a Udine o se preferite web designer SEO. Nel 2001 decisi di sezionare un sito web per vedere cosa c’era dentro, da allora creo e gestisco siti web. Lettrice onnivora, con un fisiologico bisogno di scrivere e di ballare.

Come diventare SEO:


Corso SEO

Ho inoltre raccolto le risorse più utili di questo blog per aiutare chi sta cercando di capire come si diventa SEO Specialist:

SEOZoom

Blog SEO e ultime news

In questa sezione propongo periodicamente approfondimenti a tema SEO e web marketing. Segnalo anche gli ultimi lavori di creazione siti web ad Udine e di posizionamento sui motori di ricerca. 

Perchè non leggi anche questi post?

Leggi tutti i post dal mio blog seo