Google api leak: segnali, variabili, riflessioni SEO e punti di vista
Questa guida nasce per fornire una panoramica sul recente Leak che ha coinvolto Google nella fuga di informazioni dalla quale sono state rivelate oltre 14.000 variabili e segnali (e non fattori di ranking come molti scrivono) utilizzate nel suo algoritmo di ricerca delle quali più o meno 8000 legate alla search. Vorrei raccogliere vari punti di vista e inserirli tutti qui dentro. Quindi, se anche tu fai seo e vuoi dire la tua, scrivimi!
Un’occasione unica per comprendere meglio il funzionamento interno del motore di ricerca più utilizzato al mondo anche se alcune delle cose emerse noi consulenti seo le diciamo da un po’ (in contrapposizione alla divulgazione ufficiale dei vari frontman Google come Mueller, per esempio…). Le variabili e i segnali non è specificato come vengano usati da Google e per di più c’è anche qualcosa di nuovo.
Riprenderò alcune informazioni dall’articolo Mike King (link alle fonti a fine pagina) e altre dalla repository Github (link a fine pagina nelle fonti) dalla quale è partito il leak con qualche spunto sulle ipotetiche implicazioni seo (qualora ce ne fossero di significative) accennando a segnali chiave come il CompressedQualitySignals.
Prima di iniziare a leggere la guida, però, ti chiedo:
- “Ma, quindi, la Seo è morta oppure no?“.
Ah, piccola precisazione. Sono un consulente seo ux & ai e questo articolo l’ho scritto con l’aiuto di uno dei miei Gpts (alla fine, ti svelerò quale è…).
Google api leak, un po’ di contesto sulla fuga di informazioni
La fuga di informazioni ha coinvolto oltre 2.500 documenti interni di Google, che sono stati resi pubblici tramite fonti anonime. Questi documenti offrono una panoramica dettagliata su come Google classifica i contenuti web, evidenziando i segnali e i fattori che influenzano il ranking delle pagine nei risultati di ricerca.
Google conferma l’autenticità delle informazioni trapelate sulle api ma le definisce obsolete…
Google ha confermato l’autenticità dei documenti trapelati, affermando che, sebbene le informazioni siano accurate, potrebbero mancare di contesto ed essere obsolete. Ovvio che tutti, seo e non, siano corsi ad esaminare quello che è venuto fuori ma è altrettanto vero che poter leggere certe informazioni non vuol dire sapere cosa farne o essere sicuri di aver capito quello che dicono.
La situazione è sicuramente molto delicata e va compresa facendo un grosso lavoro di condivisione con la community.
Perciò, ho deciso che in questo post inserirò tutti i punti di vista che ritengo e riterrò interessanti e utili a capirci di più.
Google leak, cosa emerge: fattori di ranking, variabili e/o segnali?
I documenti trapelati hanno rivelato una vasta gamma di segnali e di variabili che potrebbero che potrebbero aiutare Google nel determinare la posizione delle pagine nei risultati di ricerca ma non abbiamo la certezza che si tratti di fattori di ranking. Dopo questa doverosa precisazione, sotto elenco alcuni dei più significativi:
- CompressedQualitySignals: Questo messaggio contiene segnali compressi relativi alla qualità dei documenti inclusi in Mustang e TeraGoogle. Questi segnali sono utilizzati per valutare e classificare la qualità delle pagine web.
Segnali Relativi alle Recensioni di Prodotti
- productReviewPPromotePage, productReviewPPromoteSite: Segnali che indicano la probabilità che una pagina o un sito sia promosso in base alla qualità delle recensioni dei prodotti che ospitano. Ad esempio, un sito web con recensioni approfondite e imparziali potrebbe avere un valore elevato per productReviewPPromoteSite.
- productReviewPDemotePage, productReviewPDemoteSite: Segnali che indicano la probabilità che una pagina o un sito sia retrocesso a causa di recensioni false o ingannevoli.
- productReviewPReviewPage, productReviewPUhqPage: Segnali che indicano la probabilità che una pagina sia una pagina di recensioni (generica o di alta qualità). Un sito web come “CNET” che pubblica recensioni di prodotti tecnologici avrebbe probabilmente un valore elevato per productReviewPReviewPage e productReviewPUhqPage se le recensioni sono ben scritte e dettagliate.
Segnali Relativi all’Autorità e alla Qualità del Sito
- siteAuthority: Misura l’autorità di un sito web, derivata da fattori come la popolarità, i link in entrata da altri siti autorevoli e la qualità generale dei contenuti. Un sito come “Wikipedia” avrebbe un valore elevato per siteAuthority.
- authorityPromotion: Indica se un sito web è promosso in base alla sua autorevolezza.
- exactMatchDomainDemotion: Segnala se un sito web è retrocesso a causa di una corrispondenza esatta del dominio.
- nsrConfidence, nsrVersionedData: Segnali relativi al punteggio NSR (Needs Met Rating), che valuta quanto bene una pagina web soddisfa l’intento di ricerca dell’utente.
Segnali Relativi alla Qualità della Pagina
- lowQuality: Indica se una pagina web è considerata di bassa qualità.
- navDemotion, serpDemotion, anchorMismatchDemotion: Segnali che indicano se una pagina è stata retrocessa a causa di problemi di navigazione, prestazioni nella SERP o discrepanza tra anchor text e contenuto.
- pqData, pqDataProto: Segnali che codificano informazioni sulla qualità della pagina, come la leggibilità e la struttura del testo.
- babyPandaDemotion, babyPandaV2Demotion, pandaDemotion: Segnali legati all’algoritmo Panda di Google, che penalizza i siti web con contenuti di bassa qualità o duplicati.
- unauthoritativeScore: Misura quanto una pagina web è considerata non autorevole.
- scamness: Indica la probabilità che una pagina web sia una truffa.
Altri Segnali
- experimentalQstarSignal, experimentalQstarDeltaSignal, experimentalQstarSiteSignal: Segnali sperimentali utilizzati per valutare l’impatto di nuovi algoritmi e modelli sulla qualità della ricerca.
- pairwiseqScoringData, pairwiseqVersionedData: Segnali relativi a PairwiseQ, un algoritmo utilizzato per confrontare la qualità di due pagine web in relazione a una query di ricerca.
- topicEmbeddingsVersionedData: Segnali che contengono informazioni sulle versioni degli embeddings di argomenti, utilizzati per comprendere il contenuto di una pagina web.
- crapsNewUrlSignals, crapsNewHostSignals, crapsNewPatternSignals, crapsAbsoluteHostSignals, crapsUnscaledIpPriorBadFraction: Segnali legati a CRAPS, un sistema utilizzato per valutare la qualità di pagine e siti web.
Esempi concreti estratti dall’analisi della repository Google api leak
Per illustrare come adattarsi a queste nuove informazioni, ho chiesto a Gemini Advanced 1.5 di fornirmi alcuni esempi per provare a contestualizzare meglio i segnali e le variabili rilevati.
Esempi di Segnali Relativi alle Recensioni di Prodotti
- productReviewPPromotePage: Una pagina di Amazon con una recensione dettagliata e ben scritta di un nuovo smartphone potrebbe avere un valore elevato per questo segnale.
- productReviewPPromoteSite: Trustpilot, un sito web noto per ospitare recensioni autentiche di prodotti e servizi, avrebbe probabilmente un valore elevato per questo segnale.
- productReviewPDemotePage: Una pagina web contenente recensioni false o fuorvianti su un prodotto potrebbe avere un valore elevato per questo segnale.
- productReviewPDemoteSite: Un sito web noto per pubblicare recensioni a pagamento o non genuine potrebbe avere un valore elevato per questo segnale.
- productReviewPReviewPage: Un articolo su CNET che recensisce un nuovo laptop avrebbe un valore elevato per questo segnale.
- productReviewPUhqPage: Una recensione approfondita e ben documentata di un’auto elettrica su un sito web di recensioni automobilistiche autorevole potrebbe avere un valore elevato per questo segnale.
Esempi di Segnali Relativi all’Autorità e alla Qualità del Sito
- siteAuthority: Il sito web della Mayo Clinic, un’organizzazione medica rinomata, avrebbe un valore elevato per questo segnale.
- authorityPromotion: Un sito web scientifico che pubblica regolarmente ricerche peer-reviewed e articoli di esperti potrebbe ricevere un valore elevato per questo segnale.
- exactMatchDomainDemotion: Un sito web che imita l’aspetto di un sito bancario legittimo per rubare informazioni personali potrebbe essere contrassegnato da un valore elevato per questo segnale.
- nsrConfidence: Una pagina web che fornisce una risposta chiara e completa a una domanda di ricerca complessa, come “Qual è la causa del cambiamento climatico?”, potrebbe avere un punteggio elevato per questo segnale.
Esempi di Segnali Relativi alla Qualità della Pagina
- lowQuality: Una pagina web piena di errori grammaticali, con contenuti copiati da altri siti e piena di pubblicità invadenti avrebbe un valore elevato per questo segnale.
- navDemotion: Un sito web con una navigazione confusa e difficile da usare potrebbe essere penalizzato con un valore elevato per questo segnale.
- serpDemotion: Una pagina web che promette informazioni rilevanti nel titolo ma non le fornisce nel contenuto potrebbe essere retrocessa nei risultati di ricerca e avere un valore elevato per questo segnale.
- anchorMismatchDemotion: Un link che promette di portare a un articolo sulle auto elettriche ma invece reindirizza a un sito di vendita di criptovalute sarebbe un esempio di discrepanza tra anchor text e contenuto, che potrebbe portare a un valore elevato per questo segnale.
- pqData, pqDataProto: Un articolo di notizie ben strutturato con paragrafi chiari, titoli pertinenti e immagini di alta qualità avrebbe probabilmente un buon punteggio in questi segnali.
- babyPandaDemotion, babyPandaV2Demotion, pandaDemotion: Un sito web con molti articoli generati automaticamente o “content spinning” (contenuti duplicati con piccole modifiche) potrebbe essere colpito da questi segnali.
- unauthoritativeScore: Un blog personale che esprime opinioni senza alcuna prova o riferimento a fonti autorevoli potrebbe avere un valore elevato per questo segnale.
- scamness: Un sito web che offre un modo per guadagnare soldi velocemente senza alcuno sforzo o investimento potrebbe essere considerato una truffa e avere un valore elevato per questo segnale.
Esempi di Altri Segnali
- experimentalQstarSignal, experimentalQstarDeltaSignal, experimentalQstarSiteSignal: Questi segnali sono in continua evoluzione e non hanno esempi specifici in quanto sono utilizzati per testare nuovi algoritmi e modelli.
- pairwiseqScoringData, pairwiseqVersionedData: Se due pagine web rispondono alla domanda “Qual è il miglior telefono cellulare?”, PairwiseQ potrebbe confrontare la qualità delle recensioni, le specifiche tecniche e le opinioni degli esperti presenti su entrambe le pagine per determinare quale sia la migliore.
- topicEmbeddingsVersionedData: Un articolo su un nuovo farmaco potrebbe avere embeddings di argomenti relativi alla medicina, alla chimica e alla salute.
- crapsNewUrlSignals, crapsNewHostSignals, crapsNewPatternSignals, crapsAbsoluteHostSignals, crapsUnscaledIpPriorBadFraction: Un sito web nuovo che ha ricevuto molti link da siti web sospetti o che ha un indirizzo IP associato a spam potrebbe essere contrassegnato da questi segnali.
Google api leak, cosa dicono i seo online sulle nuove informazioni
Confermata l’importanza della qualità del contenuto, è essenziale investire nella creazione di contenuti originali, approfonditi e pertinenti. Ecco alcuni consigli pratici:
- Ricerca Approfondita: Prima di scrivere, esegui una ricerca approfondita per assicurarti di coprire l’argomento in modo completo e accurato.
- Uso di Dati e Statistiche: Includi dati e statistiche per supportare le tue affermazioni e aggiungere credibilità al tuo contenuto.
- Aggiornamenti Regolari: Mantieni il tuo contenuto aggiornato con le ultime informazioni e tendenze.
Ottimizzazione dei Backlink
La qualità dei backlink è cruciale per il ranking. Ecco alcune strategie per migliorare il profilo dei backlink:
- Guest Blogging: Scrivi articoli per blog autorevoli nel tuo settore e includi link al tuo sito.
- Creazione di Contenuti Condivisibili: Crea contenuti che siano facilmente condivisibili e che possano attirare link naturali da altri siti.
- Recupero di Backlink: Utilizza strumenti per identificare e recuperare backlink persi o non funzionanti.
Migliorare l’Esperienza Utente
L’esperienza utente è un altro fattore chiave. Ecco come puoi migliorare la UX del tuo sito:
- Ottimizzazione Mobile: Assicurati che il tuo sito sia completamente ottimizzato per dispositivi mobili.
- Velocità del Sito: Utilizza strumenti per migliorare la velocità di caricamento delle pagine, come la compressione delle immagini e il caching del browser.
- Navigazione Intuitiva: Progetta un layout di navigazione chiaro e intuitivo per aiutare gli utenti a trovare facilmente le informazioni che cercano.
Utilizzo dei Dati Strutturati
I dati strutturati aiutano Google a comprendere meglio il contenuto del tuo sito. Ecco come implementarli correttamente:
- Schema Markup: Utilizza schema.org per aggiungere markup ai tuoi contenuti, aiutando Google a comprendere meglio il contesto e il significato.
- Strumenti di Test: Utilizza strumenti come il Test dei Dati Strutturati di Google per verificare la correttezza e la validità del tuo markup.
Questo è quello che dicono la maggior parte degli articoli sul web mentre ciò che mi ha dato di più sono i pareri che mostro qui sotto:
Il tema importante imho in questa documentazione non è conoscere (perché non c’è) il peso di particolari elementi nell’algoritmo di ranking di ricerca, ma l'”incredibile” livello di dettagli sui dati raccolti da Google sugli utenti
— Valì Jolie (@valijolie) May 28, 2024
https://it.linkedin.com/posts/a-gozzi_google-search-seo-activity-7201134162102128640-r3Th
https://it.linkedin.com/posts/dariociraci_google-ranking-leak-activity-7201148053557252096-T53T
Google api leak, cosa ne penso io
La recente fuga di informazioni di Google offre una preziosa opportunità per comprendere meglio i fattori di ranking ma conferma che gli addetti ai lavori ovvero noi fantomatici seo ci avevamo visto giusto già qualche anno fa anche se io sono del parere che ci sia “sempre” da imparare e migliorare.
Detto questo, sta emergendo una confusione incredibile e vorrei provare a fare un minimo di chiarezza: non si tratta di fattori di ranking ma di variabili da contestualizzare, alcune delle quali confermano delle nostre ipotesi passate (di noi seo che ci sbattiamo la testa da un po’) ma di altre non siamo nemmeno sicuri del modo in cui incidano. Per venirne a capo, andrebbero organizzati cicli di confronto in tavole rotonde a più riprese con colleghi sempre differenti che diano spunti eterogenei sulla faccenda.
Per me, l’approccio più efficace è quello empirico e so che lo condividono anche altri colleghi (come l’amica Mariachiara Marsella, gli amici Michele Senatore e Demetrio Orecchio): bisogna testare tutto per verificarne l’efficacia perché tutto quello che ha funzionato su un progetto potrebbe non funzionare su un altro e tutto quello che divulga Tizio probabilmente non corrisponde alla realtà (magari, i risultati arrivano facendo l’opposto…).
Fonti:
Repository Google Api Leak semplificata
https://ipullrank.com/google-algo-leak
https://searchengineland.com/unpacking-googles-massive-search-documentation-leak-442716
https://www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo