Italy SEO Ranking Factors 2012

A seguito del mio post di venerdì, sono stato contattato da Antoine Leven di Searchmetrics, il quale mi ha proposto una succosa esclusiva: quella di poter pubblicare su questo blog, con 24 ore di anticipo su tutti gli altri, il documento relativo agli “Italy SEO Ranking Factors 2012″.

Eccoti dunque la traduzione delle 15 pagine dei fattori di posizionamento su Google – secondo Searchmetrics – relativi nello specifico al mercato italiano.

Introduzione

La più grande incognita della SEO è sempre stata l’algoritmo. Ci sono un sacco di miti e rumor che circondano cosa e come è possibile influenzare l’ordinamento dei risultati delle SERP di Google.

In Searchmetrics continuiamo ad aggregare mensilmente miliardi di dati cercando di rispondere a questa domanda: “Quali sono i fattori rilevanti per posizionarsi bene fra i risultati di Google?”

Con questo studio ci avviciniamo alla risposta, basandoci sulla selezione di 10.000 parole chiave, 300.000 siti web e milioni di link, condivisioni e tweet.

Sono stati messi a confronto i potenziali fattori di ranking valutando la correlazione statistica fra questi dati e il posizionamento dei vari siti web nei risultati di Google. Per esempio, se molte pagine sono nelle prime posizione delle SERP con la keyword nel title, abbiamo identificato questa alta correlazione.

Alcuni punti salienti emersi dallo studio

I “fattori sociali” sono sbarcati anche in Italia: i segnali di Facebook, Twitter e Google+ hanno una grande correlazione con il buon posizionamento nell’indice di Google

L’eccesso di pubblicità è dannoso: le pagine con troppi annunci pubblicitari hanno più difficoltà a posizionarsi in alto. Tuttavia, il problema sembra riguardare in particolare i blocchi di annunci AdSense

I backlink sono sempre importanti, ma la qualità non è l’unica cosa che conta: anche se il numero di backlink rimane un fattore molto importante, i link con stop word e nofollow dovrebbere essere inclusi nel mix

Per i brand valgono altri fattori: apparentemente, le pagine di noti brand possono anche non puntare su cose come title tags, headings, etc. Secondo i nostri dati, per questi siti valgono regole diverse.

I domini costituiti da parole chiave sono spesso posizionati meglio: nonostante molti dicano il contrario, i nomi a dominio con all’interno le parole chiave sono ancora vivi e vegeti, e spesso posizionati ai primi post delle SERP.

Panoramica sui fattori di ranking

Il modo più chiaro per presentare la correlazione fra i diversi fattori e i risultati di Google è usare il coefficiente di Spearman:

Ranking Factors Italy

Spiegazione: più lunga è la barra, maggiore è la correlazione. Il coefficiente di correlazione viene misurato sull’asse X. I valori più alti sull’asse (ad esempio, le condivisioni di Facebook) hanno una correlazione positiva (più è lunga la barra, meglio è), mentre i valori più bassi (ad esempio, il numero di caratteri nel titolo) hanno una correlazione negativa. Pertanto possiamo dire che la più alta correlazione si verifica per le condivisioni di Facebook, mentre la più bassa per la posizione delle parole chiave nel titolo. Prendendo ad esempio il numero di caratteri del titolo – che è un valore negativo – significa che più è corto, meglio è per il ranking.

La raccolta dei dati

I dati relativi a questo studio sono stati raccolti fra Febbraio e Marzo del 2012. Dai risultati è stato possibile vedere gli effetti che i vari Panda Update hanno avuto sul cambiamento delle SERP a partire da inizio 2011.

I fattori di posizionamento più importanti

Questi valori sono realmente utili quanto vengono organizzati tematicamente, quando vengono forniti esempi e quando la struttura dietro a questi è verificata. Questo è lo scopo del nostro studio.

I “fattori sociali” sono sbarcati anche in Italia

Il punto più interessante per chiunque sta per implementare un strategia sui social media è sapere che i “fattori sociali” sono sbarcati anche in Italia. Come si più notare, le azioni su Facebook e Twitter sono correlate ai posizionamenti più alti:

Ranking Factors - Social Signals

Diverse metriche di Facebook hanno i valori più alti, e le “condivisioni” sembrano essere quelle con un valore maggiore, addirittura più alto della somma di condivisioni, commenti e like. Twitter è molto indietro rispetto a questi valori, anche dietro alle parole chiave presenti nei backlink.
Una nota su Google+: analizzando i +1 di Google tramite la correlazione di Spearman, abbiamo ottenuto un risultato di 0,29, che si posiziona al terzo posto (fra “Facebook Total” e “Facebook Comments”).
Tuttavia, non abbiamo incluso questo dato nel grafico perché lo consideriamo troppo poco affidabile. Il motivo è che Google+ non ha abbastanza utenti, e la possibilità che un +1 possa indurre cambiamenti alle SERP segue di conseguenza. Quando Google+ dimostrerà di avere valori più forti e più indipendenti dalle SERP, allora verrà incluso nel conteggio. Il fatto che Google stia provando a rendere Google+ un player importante è comunque indiscutibile, è quindi i SEO dovrebbero sicuramente tenere d’occhio i suoi sviluppi.

2. Troppa pubblicità fa male

Un eccesso di annunci pubblicitari e/o un brutto posizionamento degli stessi pare sia uno dei fattori considerati dal Panda (e dai suoi successori). I dati di questo studio supportano questa ipotesi, e infatti portano a correlazioni negative:

Ranking Factors - Advertisement

L’uso di “adlink” (come ad esempio quelli di Commission Junction, AdSense e altri) è leggermente meno negativo che l’uso di AdSense da solo.
Tuttavia è importante notare che il valore di correlazione qui sopra è per tutte le integrazioni di “alink”, incluso AdSense. Se prendiamo il trend percentuale dell’integrazione di AdSense e analizziamo tutti gli altri network competitor in base al ranking, arriviamo a queste sorprendi conclusioni:

AdSense & AdLink

Possiamo chiaramente vedere che le pubblicità di AdSense si distanziano nettamente da tutti gli altri adlink, che in base alle analisi effettuate rimangono coerenti. La conclusione è dunque che il solo AdSense abbia una correlazione negativa.
Pertanto, sembra che ci siano più probabilità di trovare siti con poca pubblicità nelle posizioni più alte. Ovviamente, fra questi rientrano anche i siti dei brand – Sony, ad esempio, non ha alcun banner sulle sue pagine prodotto.

Di recente Google ha confermato che un accesso di pubblicità above the fold può causare problemi di ranking – e questo trend emerge precisamente dai nostri dati. Tuttavia continueremo ad osservare questi dati perché sembra che questo fattore sia rilevante solo nei primi 10 risultati e perché sembra che AdSense sia utilizzato molto più spesso su siti che si posizionano male rispetto a quelli che si posizionano meglio.

3. I backlink valgono ancora oro – ma c’è dell’altro

Indipendentemente dal crescente potere dei social media, i backlink sono e continueranno ad essere uno dei fattori più critici per raggiungere un buon posizionamento.

La cosa è supportata anche dai nostri dati – subito dopo Facebook, il numero di backlink è il fattore che più è correlato ad un buon posizionamento. Inoltre pare ci siano diversi fattori in gioco quando si parla di backlink:

Ranking Factors- Backlinks

L’immagine mostra che la proporzione di link con nofollow correlati col posizionamento è solo un poco dietro ai link contenenti parole chiave. Persino i link contenenti stop word sembra abbiano un valore. Questa forte correlazione con fattori che sembrano suggerire una struttura di link più naturale mostra un trend che molti SEO sospettavano, ovvero che spesso l’uso di link perfettamente ottimizzati non risulta più efficace, e che è necessaria una diversa strategia.

Tuttavia, il momento in cui questi fattori supereranno la mera quantità di link è ancora lontano per molte parole chiave. Prendendo il numero di link e rapportandolo al posizionamento del sito linkato per le parole chiave che abbiamo monitorato, otteniamo infatti questo:

Links

4. La potenza dei brand resiste

Per un po’ di tempo, la regola nell’ambiente SEO è stata che i brand godono di un certo vantaggio nel ranking, e quindi che è molto importante lavorare per cercare di affermarsi come brand. Tuttavia è difficile determinare il “fattore brand” in base ai dati analizzati su larga scala. E’ molto difficile venire a conoscenza dei criteri utilizzati dall’algoritmo di un motore di ricerca per determinare un brand, ma non è completamente impossibile.
In base all’analisi di alcuni fattori on-page, gli effetti della potenza del brand sono ovvi, e sembra ribaltino la “convenzionale” logica SEO. Prendiamo ad esempio questi 3 elementi, ognuno dei quali (sorprendentemente) è caratterizzato da una correlazione negativa:

Ranking Factors - Brand

Il messaggio che emerge da questa immagine è che meno una keyword appare nell’headline o nel title, e meno le parole sono inserite nel testo, meglio si posizionerà la pagina. Inoltre, la quantità di testo sembra non abbia effetti positivi. Ciò sembra essere piuttosto sorprendente. Ma se si analizzano i primi 30 risultati di Google, emerge che fino ai primi 10 i fattori si comportano come previsto, senza evidenti correlazioni in nessuna direzione. Tuttavia, al primo posto – quello “naturale” per i grossi brand – tutto viene capovolto:

Brands

Nell’immagine puoi vedere la frequenza dei fattori valutati sull’asse Y, e la posizione in Google sull’asse X. Le pagine con i valori più bassi compaiono ai primi 3 posti.
Da ciò possiamo ricavare che per finire nelle posizioni più alte non hai bisogno di parole chiave nel titolo o nell’H1 e anche il numero di parole medie tende a scendere nei primi risultati.
Il che contraddice la classica teoria SEO relativa ai fattori on-page. Per esempio, normalmente ci si aspetterebbe che una parola chiave nel titolo possa rappresentare un grande vantaggio, o che le keyword inserite nell’H1 possano avere influenza positiva. E invece pare che questi fattori vengano pesati in modo completamente diverso da Google, quando è in presenza di grossi brand: questi riescono a posizionarsi entro i primi 5 posti anche senza buone strutture on-page.
Questo effetto si è manifestato per tutto il set di parole chiave analizzate, e non solo per i brand e le combinazioni fra brand e parole chiave.

5. Le parole chiave nei domini e negli URL

La potenza delle parole chiave nei domini è nota da anni, ed è ancora chiaramente visibile dalla nostra analisi:

Ranking Factors- Keyword Domains

I domini con all’interno le keyword sono più spesso correlati con posizionamenti migliori, rispetto ai risultati di altre pagine prese a caso. La correlazione con questi domini è anche molto più alta rispetto a quella delle parole chiave nel resto dell’URL. Sebbene Google abbia sottolineato che questi siti perderanno lentamente di forza, per ora non sembra che le cose stiano così.

6. Fattori on-page addizionali

Abbiamo tentato di esaminare quanti più fattori possibili in base al loro impatto potenziale, almeno per quanto è possibile fare in base al nostro campione. Oltre ai fattori che sono riassunti nei punti principali qui sopra, ce ne sono ancora alcuni che differiscono (poco o molto) dalle nostre aspettative.
Fra questi:

Ranking Factors-Additional On-Page Factors

Anche se si può pensare che le pagine con un sacco di contenuti multimediali si possano posizionare meglio (anche indirettamente, magari tramite link ottenuti tramite social), non abbiamo rilevato alcuna forte correlazione fra un buon posizionamento e i siti con più immagini.
Allo stesso modo è inaspettata la correlazione negativa fra il posizionamento e la lunghezza del testo. In questo caso, la correlazione fra brand e ottimi posizionamenti contraddice le logiche SEO (come illustrato prima).
La lunghezza del titolo e la posizione della parola chiave nel titolo presenta una correlazione leggermente negativa. Ciò riporta alla logica in base alla quale le parole chiave piazzate prima tendono ad essere maggiormente “pesate”, e che le singole parole chiave hanno meno peso in titoli lunghi.

Attenzione a trarre conclusioni affrettate! Causa è diversa da Correlazione!

Vogliamo sottolineare che non possiamo garantire in alcun modo che i fattori indicati abbiano un effetto nel posizionamento o che possano essere utilizzati da Google come “segnali”. Domande come “un sito ottiene apprezzamenti sociali perché è posizionato bene, o è posizionato bene perché ottiene apprezzamenti sociali?” sono assolutamente valide, e non possono essere risolte in modo inequivocabile con questi dati.

Alcune informazioni circa i nostri dati

Per il nostro dataset abbiano selezionato un numero molto alto di keyword estratte da 10.000 ricerche effettuate su Google.it. Tuttavia non sono stati inclusi i primi 10.000 termini di ricerca in base al volume di ricerca, in quanto questi includono un numero spropositato di “brand keyword” che avrebbero distorto la valutazione di molti altri fattori chiave. Abbiamo invece preso un set di dati che comprende:

• un mix di parole chiave con volumi di ricerca generalmente elevati
• circa 1 parola chiave su 10 che è stata identificata come “navigation-oriented” in base alla nostra logica
• il resto sono un mix di keyword in ambito CPC, che coprono sia l’area transactional (ad alto CPC) che quella information oriented (a basso CPC), così come gli ibridi che stanno nel mezzo

La valutazione si è limitata a ricerche organiche – AdWords, Universal Search OneBoxes, 2 to 7 packs, sitelink e integrazioni iGoogle non sono stati inclusi.

L’analisi di 10.000 keyword ha portato a:

• 30.000 SERP
• con 300.000 titoli, descrizioni e URL

Il contenuto dei siti analizzati includeva:

• 14,68 GB di dati
• 162.978 annunci AdSense
• 188.200.808 commenti su Facebook, 2,3 miliardi di condivisioni e 3,3 miliardi di like