In qualità di consulente SEO per TSW, ho avuto modo di osservare che Google, in questo ultimo periodo, ha esteso le funzionalità dello strumento Google Insight for Search, dando la possibilità di vedere una previsione futura sulla stima del numero di ricerche sia a livello generale, che per categorie di ricerche o per singole ricerche. Si tratta di un’innovazione davvero affascinante che però lascia qualche dubbio: ma come fa Google a prevedere quanti utenti ricercheranno un determinato argomento? Come può un sistema prevedere eventuali fenomeni quali ad esempio l’influenza suina o la crisi economica, che inevitabilmente variano i volumi di ricerca? Indice dei contenuti: 1. Come avviene la previsione? 2. Tutte le query sono prevedibili? 2.1 La prevedibilità in relazione al Paese 2.2 La prevedibilità in base alla categoria di query 2.3 Aumenta la percentuale d’errore all’aumentare dell’orizzonte temporale della previsione? 3. Analisi dei dati a posteriori: la crisi economica vista dagli occhi di Google 3.1 La crisi dell’auto 3.2. La crescente disoccupazione negli States 3.3. Calo del settore della ristorazione in favore del fai-da-te 4. Conclusione 1. Come avviene la previsione? Indubbiamente Google non ha la sfera di cristallo ma, grazie ai dati in sui possesso, è in grado di costruire dei modelli di previsione simili a quelli utilizzati in ambito finanziario. In sostanza vengono esaminati i trend del numero di ricerche del passato (Google ha uno storico consistente a partire da gennaio 2004) e vengono isolate tre componenti che ne determinano l’andamento nel corso del tempo: • andamento generale: ovvero qual’è l’andamento generale (il numero di ricerche medio ed il trend in crescita/diminuzione); • stagionalità: quanto durante l’arco dell’anno di valori si discostano rispetto al trend generico (ad es. periodo estivo per il travel, periodo natalizio per lo shopping, ecc.); • residuo: lo scostamento dalle due precedenti componenti. Una volta individuate queste componenti e capito quale sia il loro andamento nel passato, sarà possibile estendere lo stesso trend, sottoforma di stima, anche al futuro in modo abbastanza fedele alla realtà. Qui potete trovare informazioni maggiori: • On the Predictability of Search Trends: Post sul blog di Google Research • On the Predictability of Search Trends: White Paper completo • Predicting the Present with Google Trends: White paper di Google Research – Aprile 2009 2. Tutte le query sono prevedibili? Google ha svolto un esperimento per capire quali query sono prevedibili e quali siano gli eventuali margini di errore. In generale quanto più le query sono soggette a fenomeni socio-economici importanti, quanto più esse avranno carattere di grande variabilità e quindi di imprevedibilità. Basti pensare, ad esempio, al numero di ricerche per le parole chiave Obama o influenza suina:

Trend ricerche per Obama

Trend ricerche per Obama

Trend ricerche per influenza suina

Trend ricerche per influenza suina. L’esperimento: • prende come dati storici di riferimento il periodo tra Gennaio 2004 e Luglio 2008; • vengono stimati i dati di traffico tra Agosto 2008 e Luglio 2009; • vengono confrontati i dati di traffico stimati nel periodo Agosto 2008 e Luglio 2009 con quelli reali. Sulla base della differenza tra dati reali e dati stimati sarà possibile dire quali query non sono prevedibili e con che grado di fedeltà questo modello di previsione agisce. 2.1 La prevedibilità in relazione al Paese Il primo dato che salta subito all’occhio è la vista aggregata del numero di query prevedibili a seconda della nazione di riferimento. Per quest’indagine sono stati utilizzati i dati delle 10.000 query più utilizzate per USA, UK, Germania, Francia e Brasile.

Gli utenti di ciascuna nazione hanno estrazioni sociali e bacini di utenza diversi, hanno un utilizzo del motore di ricerca diverso e sono soggetti a fenomeni socio-economici diversi. Questi fattori in qualche misura fanno variare la percentuale di query che possono essere prevedibili o meno. 2.2 La prevedibilità in base alla categoria di query Il secondo dato molto interessante è sul mercato Usa e mostra il grado di prevedibilità e stagionalità per le 1.000 query più utilizzate per le 10 categorie principali:

In questa tabella viene mostrato come a seconda delle categorie di query, vi è un grado di prevedibilità e di stagionalità diversa (il grado di stagionalità è dato da un confronto diretto tra l’andamento del trend delle ricerche osservato ed il trend delle ricerche normalizzato dalla variabilità dovuta alla stagionalità). Le query in materia di salute sembrano avere un comportamento abbastanza regolare nel corso del tempo vista la loro grande prevedibilità ed il basso errore medio. Le query riguardanti, invece i Social Network, essendo soggette ai trend sempre nuovi della rete hanno di per sé una connotazione di imprevedibilità: infatti solo il 27,5% delle query risultano prevedibili. Inoltre questa categoria non pare soggetta a stagionalità. I settori più soggetti a stagionalità sono le categorie caratterizzate da festività e da periodi di sconti: alimentazione, shopping e turismo. 2.3 Aumenta la percentuale d’errore all’aumentare dell’orizzonte temporale della previsione? Sono state fatte delle analisi per capire quanto il modello di previsione sia affidabile nell’arco temporale di un anno con i dati attualmente a disposizione da Google. Attualmente il modello ha un errore medio assoluto di previsione variabile che parte da un valore dell’8%, per il primo mese, fino ad arrivare ad un massimo del 15% per il 12mo mese.

Quindi all’aumentare dell’ampiezza dell’intervallo futuro, aumenterà di conseguenza la percentuale di errore nella predizione. 3. Analisi dei dati a posteriori: la crisi economica vista dagli occhi di Google Un’analisi a posteriori delle stime di traffico effettuate da Google, rispetto al reale andamento delle ricerche può essere fonte di interpretazioni interessanti: • un volume di ricerche effettive maggiore rispetto alle ricerche stimate significa che gli utenti riscontrano un interesse maggiore per un dato argomento rispetto al passato; • viceversa ricerche inferiori dimostrano un calo dell’interesse degli utenti. Google ha sfruttato il suo sterminato campione di utenze anche per verificare se alcuni aspetti della crisi economica hanno un reale riscontro anche sulle ricerche degli utenti con risultati davvero molto interessanti. Eccone alcuni esempi: • la crisi del settore dell’automotive; • la crescente disoccupazione; • calo del settore della ristorazione in favore del fai-da-te 3.1 la crisi dell’auto Nel caso della crisi del auto si può notare come le query riguardanti i brand del settore rimangono pressochè invariate, sintomo che un interesse rivolto verso il prodotto auto ed in particolare dei brand marchi è tuttora invariato.

Le query riguardanti da un lato l’acquisto e dall’altro la riparazione delle auto hanno andamenti straordinariamente speculari: si registra infatti un calo del 6% circa contrapposto ad una crescita del 7%.

E’ quindi chiaro che una porzione di utenti che, nelle attese avrebbe dovuto essere interessata all’acquisto di un’auto, invece opta per la riparazione. 3.2. la crescente disoccupazione negli States In questi due grafici è raffigurata la sensibile crescita delle ricerche correlate al reperimento di informazioni in materia di disoccupazione e ricerca impiego negli Stati Uniti.

3.3. Calo del settore della ristorazione in favore del fai-da-te Anche in questo grafico si nota il calo delle ricerche sul tema “ristoranti” ed una crescita di ricerche sul tema delle ricette ed in generale della cucina fai-da-te.

4. Conclusione E’ indubbio che il patrimonio informativo di cui dispone Google sia davvero immenso, ma il fatto che possano effettuare anche indagini di questo genere lascia davvero esterrefatti. Gli utenti di Google, diventano un campione più o meno fedele, per analizzare i comportamenti dell’intera società moderna: gli effetti della divulgazione di notizie, i nuovi trend della moda, gli interessi, la popolarità dei politici, l’interesse del mercato per un determinato prodotto, ecc. Forse la sociologia del 2050 lascerà da parte i sondaggi nelle piazze e nelle strade per chiedere direttamente a Google i dati per svolgere delle ricerche? Forse le indagini di mercato si faranno solo con Google Insight for Search? Forse le decisioni di marketing delle aziende verranno prese analizzando in modo così avanzato il traffico del proprio sito? O forse sono solo deliri di questa seconda metà del 2009? Autore: Andrea Vit (per il TagliaBlog).