Google’s Reasonable Surfer: non tutti i link pesano allo stesso modo

Non tutti i link di una pagina, in un sistema di classificazione basato sui link, sono da considerarsi uguali, e un motore di ricerca potrebbe considerare un’ampia gamma di fattori per determinare come “pesare” ogni singolo link presente sulla pagina.

Google's Reasonable Surfer

Uno dei parametri utilizzati da Google per classificare le pagine web è guardare i link da e verso quelle pagine, per vedere come sono collegate fra loro. Link da pagine “importanti” hanno un peso maggiore di link da pagine meno importanti. In questo ambito, una pagina è considerata importante quando è linkata da altre pagine importanti, da un gran numero di pagine meno importanti, o da una combinazione delle 2 cose. Questo parametro è chiamato PageRank, ed è solo uno dei numerosi fattori di ranking utilizzati da Google per classificare le pagine web e determinare il posizionamento delle stesse nelle pagine dei risultati del motore di ricerca, in risposta alle query degli utenti.

In un documento anticipato dai fondatori di Google, The Anatomy of a Large-Scale Hypertextual Web Search Engine, possiamo leggere:

Il PageRank può essere visto come un modello di comportamento dell’utente. Prendiamo per assunto che un “navigatore casuale” è colui che parte da una pagina web e continua a cliccare sui link, senza mai cliccare sul tasto “indietro” del browser; alla fine si annoia e riparte da un’altra pagina a caso. La probabilità che il navigatore casuale visiti una pagina costituisce il suo PageRank.

Partendo da questo approccio, qualsiasi link presente sulla pagina potrebbe avere lo stesso peso/importanza, quando punta ad un’altra pagina.

Un brevetto di Google presentato nel 2004 e concesso pochi giorni fa, ha però un approccio leggermente diverso nei confronti del valore che i link potrebbero avere quando presenti all’interno della stessa pagina:

Sistemi e metodi coerenti con i principi dell’invenzione possono fornire un modello del “navigatore ragionevole” che indica che, quando un navigatore accede a un documento con una serie di link, seguirà alcuni di questi link con maggiori probabilità rispetto ad altri.

Questo modello riflette il fatto che non tutti i link associati a un documento hanno la stessa probabilità di essere seguiti. Esempi di link con poche probabilità di essere seguiti sono quelli ai “Terms of Service”, quelli inclusi nei banner e i link non correlati al documento stesso.

Il brevetto in questione è Ranking documents based on user behavior and/or feature data, e questo è l’abstract:

Un sistema genera un modello basato sui dati relativi alle differenti caratteristiche di un link da un documento linkante a un documento linkato, e i dati relativi al comportamento dell’utente in base alle azioni di navigazione associate al link. Il sistema assegna anche un “punteggio” (rank) al documento in base a questo modello.
In questo modello del “navigatore ragionevole” non tutti i link che compaiono su una pagina hanno uguale valore. Le differenti caratteristiche associate al link, e le pagine in cui appaiono e dove puntano, possono determinare il valore che questi link passano alle pagine alle quali puntano.

Come queste caratteristiche potrebbero influenzare il peso di un link

Questo modello ha lo scopo di determinare la probabilità che un link su una pagina possa essere scelto in base agli aspetti positivi e negativi delle caratteristiche che lo contraddistinguono.

Per esempio, un link con un anchor text più grande di una certa dimensione può avere più probabilità di essere scelto rispetto ad uno di dimensioni inferiori. I link posizionati più in alto in una pagina possono avere maggior probabilità di essere cliccati. Se l’argomento del documento è correlato a quello al quale punta il link presente sulla pagina, il link ha maggiore probabilità di essere cliccato dall’utente. Pertanto un link con un carattere più grande, posizionato in alto, che porta ad una pagina correlata, ha maggiore probabilità di essere cliccato rispetto ad un link piccolo, in fondo alla pagina, che punta ad un argomento scollegato.

Il brevetto fornisce una serie di altri esempi di regole che possono essere applicate a diverse caratteristiche per determinare i link presenti sulla pagina, che potrebbero essere scelti e cliccati da un utente. Tali probabilità sono utilizzate per determinare il “peso dinamico” per ogni singolo link, e quanto questo può influenzare le pagine alle quali punta. Link con pesi diversi potrebbero determinare quanto PageRank ogni singolo link passa alle altre pagine.

Oppure, come dice il brevetto:

Il rank di un documento può essere interpretato come la probabilità che un “navigatore ragionevole” acceda ad un documento dopo aver seguito un certo numero di link.

Concludendo

Quanto valore potrebbe passare un link su una pagina insieme ad un sistema di classificazione basato sui link come il PageRank?

In base al brevetto appena concesso, il valore di un link può essere determinato da un gran numero di fattori, come la posizione del link sulla pagina, il colore e il font del link rispetto agli altri link presenti sulla pagina, il numero di parole usate per comporre l’anchor text del link, se il link è di tipo “commerciale” o meno, qual’è il tema della pagina nel quale è presente il link e il tema di quella al quale punta, e molti altri parametri.

E’ probabile che Google si sia spostato rapidamente da quella che era la definizione del PageRank del 1999 – The PageRank Citation Ranking: Bringing Order to the Web -, nella quale si evinceva che il peso dei link veniva diviso in parti uguali fra tutti i link in uscita da una pagina. Questo nuovo brevetto descrive invece un buon numero di approcci che Google può utilizzare per pesare il valore dei link in modo diverso, anche se è probabile che alcuni non siano linee guida definitive.

Ci sono comunque delle regole di massima molto utili: quali link hanno maggiori probabilità di essere selezionati da un “navigatore ragionevole”, e quali di questi link, probabilmente, hanno un peso maggiore.

Liberamente tradotto da Google’s Reasonable Surfer: How the Value of a Link May Differ Based upon Link and Document Features and User Data, di Bill Slawski (SEO by the Sea).

Condividi su facebook
Facebook
Condividi su google
Google+
Condividi su twitter
Twitter
Condividi su linkedin
LinkedIn
Condividi su pinterest
Pinterest

18 Comments

  • Ciao
    da poco mi sto affacciando al mondo SEO e devo dire che il tuo blog è stato uno dei primi che ho scoperto per caso.
    La faccenda dei link interni mi ha sempre creato un dubbio.
    Come dici giustamente tu, Google considera molto sia i links in entrata, sia i links a cui la pagina punta.

    Ora tento di esporti la mia domanda con il mio esempio personale:
    io ho un blog, nel testo inserisco un link, in alto, che punta ad una pagina correlata con il contenuto. Questa azione, però, non è controproducente per me che scrivo?
    Nel senso: considerando che il mio fine è quello di far leggere il post che ho scritto, quante probabilità ci sono che il lettore, ritorni a leggere il mio blog una volta visitata la pagina che io suggerisco con il link?

    Scusa se la domanda è stupida ma ripeto, sono nuovo dell’ ambiente.
    Giuseppe

  • Se hai creato un contenuto di valore o comunque utile il lettore tornerà, inoltre se gli hai fornito un link interessante e pertinente questo aumenta la qualità della tua pagina, perchè dimostra che sai guardarti in giro e fornire spunti interessanti.

    Linkare contenuti esterni di valore è utile per l’utente, quindi di riflesso verrai premiato anche da Google per questo; dal punto di vista SEO credo che il fine ultimo sia proprio questo, dimostrare di essere preziosi per l’utente in modo da essere premiati dai motori di ricerca.

  • Google dovette svincolarsi dal pagerank nella sua formulazione originaria, poco prima di quotarsi in borsa, per due ottimi motivi: 1) invecchiamento del criterio (ormai da tempo tutti avevamo capto come gabbarlo) e 2) il brevetto dell’algoritmo da cui derivata la superiorità del motore di ricerca, non era di proprietà di Google (non ricordo se era della Stanford university o dello stato della California). Tutti abbiamo visto il disastro dei primi tentativi (il funesto Florida update prima delle vendite di natale del novembre 2003 ed i successivi scossoni ). Recentemente è venuto fuori il Sitelink che nei risultati della ricerca, per siti ben trafficati, oltre alla riga principale, visualizza anche altri link importanti del sito ed a volte anche recensione e molto altro (vedi siti di prenotazioni aeree). Come fa Google a sapere se quei link sono importanti? Non credo che si prenda la briga di analizzare se un link verrà visualizzato a destra o a sinistra, in alto o in basso, oppure facendo il parsing della cascata gerarchica dei CSS, fino a stabilire se un link ha un carattere grande o piccolo o se ha un colore che staglia sullo sfondo (per non parlare del sempre più presente ajax). La spiegazione che sembra più plausibile è che utilizzi il tracciamento dei dati degli utenti (si spera in forma aggregata) per tracciare i percorsi a maggior valore per i visitatori, quelli con minore bounce rate, con maggior time on page. Google Analytics potrebbe essere il veicolo dell’informazione, oltre ai click tracciati sulle SERP. Di sicuro sarà sempre più importante soddisfare le aspettative dei clienti per avere un buon ranking.

  • Insomma si passa dal concetto di PageRank a quello di “LinkRank” (passatemi il termine). Non basterà più avere un link da una pagina importante, per migliorare il proprio punteggio, ma servirà un link importante da una pagina importante.

  • “Se l’argomento del documento è correlato a quello al quale punta il link presente sulla pagina, il link ha maggiore probabilità di essere cliccato dall’utente.”

    Vero! Succede più o meno la stessa cosa con AdSense alla fine, anche se sono due cose differenti tra loro.
    Mi permetto di sottolineare un altro aspetto che hai citato (e che molto spesso viene sottovalutato da molti), cioè l’anchor text: magari da solo non può influenzare il posizionamento di una pagina, ma visto che c’è e ha una funzione ben precisa… tanto meglio usarlo, no? 😉

  • La prima che cosa che mi viene in mente è che bisognerà lavorare molto a livello di design, soprattutto su siti che fanno uso di cms, che solitamente strutturano tutti in link in maniera uniforme…

  • @Giuseppe: ecco come la vedo io:
    Quando devi decidere se linkare o meno una risorsa esterna l’unica cosa che devi chiederti è: “questa risorsa sarà utile per il mio lettore?”. Se la risposta è sì aggiungi il link senza paura di perdere un utente.
    Probabilmente succederà esattamente il contrario: l’utente riconoscerà il tuo blog come fonte di informazione (anche esterna) autorevole e tornerà a visitarti.
    Se poi vuoi “forzare” questo processo, puoi fare in modo di aprire tutti i link a risorse esterne in una nuova pagina. In questo modo il tuo blog rimarrà sempre davanti agli occhi del lettore.

  • Conoscere gli algoritmi di Google è sicuramente importante, ma come dice Roberto, la cosa migliore è lavorare per l’utente utilizzando il buon senso.

  • In effetti il buon lavoro che ha fattto Google in questi anni è consistito nell’individuare le tecniche SEO “aggressive” e renderle penalizzanti.

    In questo modo chi fa posizionamento sa che anche se utilizzerà un trucchetto che oggi funziona magari domani si troverà la pagina penalizzata.

    Dopo qualche anno di bastonate ai SEO cattivi ora abbiamo perlopiù SEO buoni che cercano di lavorare sulla qualità dei contenuti prima di tutto. Certo, date queste premesse, vendere il SEO ad un cliente non ferrato in materia diventa più difficile perchè gli orizzonti temporali e soprattutto l’investimento in termini di lavoro sul sito sono molto meno invitanti: in pochi, tra i clienti, hanno voglia di lavorare sul medio periodo..

  • Ciao,
    lavoro in un’azienda di informatica americana non meno conosciuta di Google. Qualche chiarimento sui patent. Innanzittutto non è scritto da nessuna parte che un patent approvato significhi che è stato anche implementato. Anzi, spesso è vero il contrario. Implementare cosa ha un costo maggiore che non pensarle, per cui nel frattempo si brevetta poi si vede …

    Secondo me il 70% dei brevetti non viene e non verrà mai implementato.

    Non so come funziona il sistema interno Google ma credo che come la mia company abbia un processo interno di approvazione con vari stati. Quando li supera tutti viene sottoposto al patent office (poi ci sono vari regolamenti tra quello europeo e americano).

    Nella mia company (e credo anche in Google) il dipendente o più dipendenti sottopongono l’idea. Viene discussa in sede specifica. Viene poi fatta una ricerca sulle prior art e dopo un processo lunghino ti porti a casa XX Euro anche se poi il patent office non lo approverà mai.

    Ci sono persone che si fanno un stipendio a parte su queste cose. Puoi sottoporre quasiasi cavolata con il vincolo che sia legato al business per azienda ed è probabile che il patent che fai non sarà legato espressamente all’attività che fai anche se dovrebbe essere vero il contrario.

    Non è raro (e non solo in Italia) che controllati e controllori siano le stesse persone quindi non è difficilissimo passare i vari test …

    Credo accade lo stesso in Google dove magari a qualcuno in India viene in mente una tecnica sui Link quando però egli non lavorerà mai con il team x Webmaster.

    Tutto questo per dirvi di stare attenti a guardare i patent … non è detto che siano realmente implementati … anzi sono spesso un mezzo per i dipendenti per brevettare le più grosse cavolate per arrotondare lo stipendio.

    Infatti, c’è sempre l’enfasi nel sostenere che “non c’è bisogno di inventare il raggio laser, o il teletrasporto …” ma cose anche banali che possono portare valore aggiunto …

    Se vi dicessi le cazzate che si brevettano …

  • Post molto interessante.

    C’è anche un implicito parecchio rilevante: se “Esempi di link con poche probabilità di essere seguiti sono (…) quelli inclusi nei banner”, il sistema di pagamento di Google Ads, che tende a pagare quasi solo per i clic, diventa incongruo. C’è una grande sproporzione fra la capacità di un’immagine di attrarmi e indurmi ad acquistare un prodotto/visitare un sito e la probabilità che io ci clicchi.

    (Oltre al rischio che ads disattivi l’account così, solo perché quel giorno gli gira, ça va sans dire).

  • Cosa farei senza questi tuoi interessanti consigli? Grazie.

  • Grazie a tutti per la risposta.
    Ora ho le idee un pò più chiare e non vedo l’ora di sperimentare i vostri suggerimenti 😀

    Alla prossima

  • Articolo interessante… segnalo il servizio di linkdiagnosis che indica la forza che ha una pagina in base a diversi fattori

  • Post e commenti molto interessanti :)!

    @giuseppe, a quanto ne so io ti conviene usare il nofollow, oltre che ovviamente il target=”_blank”, quando linki all’esterno.

    Non ho il link sotto mano, ma trovi diverse risorse in inglese che ti confermano come altrimenti rischi il cd. “pagerank bleeding” verso terzi; discorso a parte, naturalmente, se rilinki verso altri siti tuoi.

  • Ma io nn ho capito una cosa..come si fa a capire se un link verrà tracciato o meno?cioè se io inserisco il mio link come ad esempio nel mio nick..verrà tracciato o meno?
    grazie mille

Rispondi

Max Valle
Max Valle

Da oltre 20 anni, fornisco consulenze per aziende e professionisti, che vogliono sviluppare il loro business, aumentando i clienti, utilizzando le ultime tecnologie e nel pieno rispetto delle normative vigenti in materia.

Seguimi sui social
Iscriviti alla Newsletter
Main sponsor

Sponsor

Scroll to Top