Google Search Console, errore di reindirizzamento
Spesso capita che, dopo aver richiesto l’indicizzazione di alcune risorse, la Google Search Console restituisca un errore nel rapporto di copertura denominato “Errore di reindirizzamento” a causa del quale le url corrispondenti a quelle pagine web vengono bloccate e, di conseguenza, escluse dall’indice del motore di ricerca.
Tutti tra colleghi seo e proprietari siti web lo hanno visto almeno una volta e, se non vi è mai capitato, attenzione perché potrebbe succedere prima di quanto pensiate. E, considerato che personalmente l’ho visto diverse volte, ho deciso di raccontare come l’ho interpretato e cosa ho fatto per risolverlo ed indicizzare le pagine web che mi venivano bloccate dall’errore.
Per approfondire invece la rimozione di informazioni personali di un individuo presenti in indice Google, qui ho scritto una guida per rimuovere dalle serp i risultati con informazioni personali.
Perché Google Search Console segnala l’errore di reindirizzamento
Sono diversi i motivi che possono contribuire al verificarsi di questo errore:
- sulla url che si richiede di indicizzare attraverso Google Search Console è stato impostato un redirect 301 che punta verso un’altra url diversa da quella inviata per l’indicizzazione;
- la pagina di referral contiene un link interno che punta alla risorsa di partenza del redirect e non a quella di destinazione;
- le pagina di destinazione contiene un canonical che punta alla url di partenza mentre l’url di destinazione è diverso.
Questi fattori hanno avuto un peso non indifferente quando è capitato a me e ragionarci su mi ha aiutato a trovare l’ispirazione o meglio una soluzione.
Secondo la mia esperienza, le situazioni che favoriscono il verificarsi di questo errore sono quelle nelle quali il sito web contiene url simili che puntano a pagine identiche raggiungibili sia con / finale che senza / finale e generano quindi potenziali duplicati (questo problema può essere risolto usando semplicemente i canonical ma c’è anche chi preferisce scrivere una regoletta di redirect). Mentre una delle principali azioni alle quali fare attenzione è la richiesta dell’url corretto da indicizzare (se per esempio l’url canonico è quello senza /, sarà corretto richiedere di indicizzare quello e lo stesso vale per l’url di destinazione dell’ipotetico redirect).
Ma cosa scatta nel crawler di Google quando scansiona una risorsa?
Il crawler prima di visitare la pagina web procede con la fase di rilevamento nella quale legge la sitemap e verifica la presenza di link che puntino alla risorsa candidata per l’indicizzazione.
Poi, passa alla fase di scansione recuperando la pagina e verificando che non siano presenti blocchi dal robots.txt e/o meta robots=”noindex” – ed è proprio in questa fase che ha riscontrato il problema mentre tenta di recuperare la pagina che punta ad un url diverso da quello cercato e si blocca restituendo l’errore (come si vede nell’immagine di esempio).
Ed, infine, controlla il contenuto canonical dichiarato nel codice html (se presente… :)) e lo sottopone a Google (che decide se seguire quell’indicazione lì oppure attribuire un’altra risorsa come canonica) per procedere con la fase di indicizzazione – ma, non avendo proseguito nel recupero della risorsa a causa del redirect, il crawler non procede con questa fase.
Come risolvere l’errore in Google Search Console e indicizzare la risorsa
Nel caso specifico del quale sto parlando, c’erano tutti e tre i problemi che ho menzionato all’inizio. Perciò, ho fatto dei test e sperimentato più di una soluzione.
Quale ha funzionato? Ve lo racconto subito.
Per prima cosa, ho corretto i link interni inseriti nella pagina di referral già indicizzata e i link canonici. Dopodiché, ho richiesto nuovamente l’indicizzazione delle risorse segnalando a Google le url di destinazione dei redirect 301 (che in questo caso erano quelle senza lo / finale).
E la risposta del motore di ricerca è stata velocissima: dopo qualche minuto, le pagine risultavano già indicizzate dalla Search Console e presenti nei risultati di ricerca Google.
Qui puoi puoi approfondire le variabili emerse dall’ultimo Google Leak