Non tutti i link di una pagina, in un sistema di classificazione basato sui link, sono da considerarsi uguali, e un motore di ricerca potrebbe considerare un’ampia gamma di fattori per determinare come “pesare” ogni singolo link presente sulla pagina.

Google's Reasonable Surfer

Uno dei parametri utilizzati da Google per classificare le pagine web è guardare i link da e verso quelle pagine, per vedere come sono collegate fra loro. Link da pagine “importanti” hanno un peso maggiore di link da pagine meno importanti. In questo ambito, una pagina è considerata importante quando è linkata da altre pagine importanti, da un gran numero di pagine meno importanti, o da una combinazione delle 2 cose. Questo parametro è chiamato PageRank, ed è solo uno dei numerosi fattori di ranking utilizzati da Google per classificare le pagine web e determinare il posizionamento delle stesse nelle pagine dei risultati del motore di ricerca, in risposta alle query degli utenti. In un documento anticipato dai fondatori di Google, The Anatomy of a Large-Scale Hypertextual Web Search Engine, possiamo leggere:

Il PageRank può essere visto come un modello di comportamento dell’utente. Prendiamo per assunto che un “navigatore casuale” è colui che parte da una pagina web e continua a cliccare sui link, senza mai cliccare sul tasto “indietro” del browser; alla fine si annoia e riparte da un’altra pagina a caso. La probabilità che il navigatore casuale visiti una pagina costituisce il suo PageRank.

Partendo da questo approccio, qualsiasi link presente sulla pagina potrebbe avere lo stesso peso/importanza, quando punta ad un’altra pagina. Un brevetto di Google presentato nel 2004 e concesso pochi giorni fa, ha però un approccio leggermente diverso nei confronti del valore che i link potrebbero avere quando presenti all’interno della stessa pagina:

Sistemi e metodi coerenti con i principi dell’invenzione possono fornire un modello del “navigatore ragionevole” che indica che, quando un navigatore accede a un documento con una serie di link, seguirà alcuni di questi link con maggiori probabilità rispetto ad altri. Questo modello riflette il fatto che non tutti i link associati a un documento hanno la stessa probabilità di essere seguiti. Esempi di link con poche probabilità di essere seguiti sono quelli ai “Terms of Service”, quelli inclusi nei banner e i link non correlati al documento stesso.

Il brevetto in questione è Ranking documents based on user behavior and/or feature data, e questo è l’abstract:

Un sistema genera un modello basato sui dati relativi alle differenti caratteristiche di un link da un documento linkante a un documento linkato, e i dati relativi al comportamento dell’utente in base alle azioni di navigazione associate al link. Il sistema assegna anche un “punteggio” (rank) al documento in base a questo modello. In questo modello del “navigatore ragionevole” non tutti i link che compaiono su una pagina hanno uguale valore. Le differenti caratteristiche associate al link, e le pagine in cui appaiono e dove puntano, possono determinare il valore che questi link passano alle pagine alle quali puntano.

Come queste caratteristiche potrebbero influenzare il peso di un link Questo modello ha lo scopo di determinare la probabilità che un link su una pagina possa essere scelto in base agli aspetti positivi e negativi delle caratteristiche che lo contraddistinguono. Per esempio, un link con un anchor text più grande di una certa dimensione può avere più probabilità di essere scelto rispetto ad uno di dimensioni inferiori. I link posizionati più in alto in una pagina possono avere maggior probabilità di essere cliccati. Se l’argomento del documento è correlato a quello al quale punta il link presente sulla pagina, il link ha maggiore probabilità di essere cliccato dall’utente. Pertanto un link con un carattere più grande, posizionato in alto, che porta ad una pagina correlata, ha maggiore probabilità di essere cliccato rispetto ad un link piccolo, in fondo alla pagina, che punta ad un argomento scollegato. Il brevetto fornisce una serie di altri esempi di regole che possono essere applicate a diverse caratteristiche per determinare i link presenti sulla pagina, che potrebbero essere scelti e cliccati da un utente. Tali probabilità sono utilizzate per determinare il “peso dinamico” per ogni singolo link, e quanto questo può influenzare le pagine alle quali punta. Link con pesi diversi potrebbero determinare quanto PageRank ogni singolo link passa alle altre pagine. Oppure, come dice il brevetto:

Il rank di un documento può essere interpretato come la probabilità che un “navigatore ragionevole” acceda ad un documento dopo aver seguito un certo numero di link.

Concludendo Quanto valore potrebbe passare un link su una pagina insieme ad un sistema di classificazione basato sui link come il PageRank? In base al brevetto appena concesso, il valore di un link può essere determinato da un gran numero di fattori, come la posizione del link sulla pagina, il colore e il font del link rispetto agli altri link presenti sulla pagina, il numero di parole usate per comporre l’anchor text del link, se il link è di tipo “commerciale” o meno, qual’è il tema della pagina nel quale è presente il link e il tema di quella al quale punta, e molti altri parametri. E’ probabile che Google si sia spostato rapidamente da quella che era la definizione del PageRank del 1999 – The PageRank Citation Ranking: Bringing Order to the Web -, nella quale si evinceva che il peso dei link veniva diviso in parti uguali fra tutti i link in uscita da una pagina. Questo nuovo brevetto descrive invece un buon numero di approcci che Google può utilizzare per pesare il valore dei link in modo diverso, anche se è probabile che alcuni non siano linee guida definitive. Ci sono comunque delle regole di massima molto utili: quali link hanno maggiori probabilità di essere selezionati da un “navigatore ragionevole”, e quali di questi link, probabilmente, hanno un peso maggiore. Liberamente tradotto da Google’s Reasonable Surfer: How the Value of a Link May Differ Based upon Link and Document Features and User Data, di Bill Slawski (SEO by the Sea).