Contenuti freschi e contenuti… stantii

Un motore di ricerca si nutre di contenuti: ne vuole continuamente di nuovi, per ordinare e alimentare le sue SERP e per offrire un sempre miglior servizio ai suoi utenti.

E’ probabilmente per questo motivo che spesso si usa dire “Google ama i blog”: i blog, e più in generale gli user generated content, sono per Google una sorta di enorme serbatoio nel quale confluiscono ogni istante tonnellate di informazioni, e dentro il quale il motore può attingere per estrarre in continuo documenti freschi.

Ma il web è pieno anche di contenuti vecchi: interi siti abbandonati alla deriva, dimenticati, congelati da anni.

Per Google, uno stale document è un documento che non è stato aggiornato per un periodo di tempo e, di conseguenza, contiene dati stantii.

Google e i documenti stantii

Lo staleness di un documento sembrerebbe sia appurato da Google sulla base di 4 parametri:

  • la data di creazione del documento
  • il traffico
  • la variazione dei contenuti
  • la crescita/decrescita dei link in ingresso

Questo brevetto spiega infatti come Google analizzi in dettaglio 4 fattori principali:

  1. Query: il motore analizza quali documenti nella SERP vengono preferiti dagli utenti. Con buona probabilità, fra quelli “scartati” ci sono parecchie pagine stale
  2. Link: guardando la velocità con cui la pagina prende o perde link nel corso del tempo, e analizzando il numero di quanti link vengono aggiunti o tolti, il motore di ricerca è in grado di capire se vi sia tendenza verso la comparsa di nuovi link piuttosto che verso la scomparsa dei link attualmente presenti. E’ chiaro che una tendenza al ribasso dei link in entrata e/o una diminuzione dei link già esistenti sono fattori negativi, che portano a flaggare il documento come stale.
  3. Traffico: una grossa riduzione di traffico è indicatore di documento stale.
  4. Comportamento dell’utente: se l’utente spende troppo poco tempo sulla pagina (comparato al tempo speso su altre pagine simili / con la stessa rilevanza) significa che il documento è stale.

Conclusione

Ribaltando ciò che Google vede come “stantio”, possiamo anche capire cosa Google ama, ovvero:

  • le pagine più cliccate dagli utenti all’interno delle SERP
  • un buon numero di link, aggiunti costantemente e in modo continuativo nel corso del tempo
  • il traffico stabile (o crescente)
  • un buon tempo di permanenza sul sito

Lavora quindi su questi 4 fattori, e sicuramente Google ti premierà 🙂

Fonte: Stale vs Fresh Document as Defined by Google.

Condividi su facebook
Facebook
Condividi su google
Google+
Condividi su twitter
Twitter
Condividi su linkedin
LinkedIn
Condividi su pinterest
Pinterest

8 Comments

  • Quindi i click sulla pubblicità, che diminuiscono il tempo di permanenza, potrebbero contribuire ad etichettarci come “stale”… :mrgreen:

  • Ottimi consigli, solo su un punto non sono completamente d’accordo. Scrivi:
    “Query: il motore analizza quali documenti nella SERP vengono preferiti dagli utenti. Con buona probabilità, fra quelli “scartati” ci sono parecchie pagine stale”

    Difficilmente un utente riesce a percepire da title + snippet se una pagina è aggiornata o meno. Più probabilmente la aprirà e dopo pochi secondi la chiuderà, tornando alla SERP. Il solo fatto che un risultato venga cliccato non significa che non sia “stale”.
    Sbaglio?

  • @Roberto: hai ragione, ho semplificato all’eccesso… solo questo punto meriterebbe più di un post a parte 🙂
    Infatti nel brevetto, nel capitolo relativo all’analisi delle query, ci sono parecchi spunti…:

    “According to an implementation consistent with the principles of the invention, one or more query-based factors may be used to generate (or alter) a score associated with a document. For example, one query-based factor may relate to the extent to which a document is selected over time when the document is included in a set of search results. In this case, search engine 125 might score documents selected relatively more often/increasingly by users higher than other documents.

    Another query-based factor may relate to the occurrence of certain search terms appearing in queries over time. A particular set of search terms may increasingly appear in queries over a period of time. For example, terms relating to a “hot” topic that is gaining/has gained popularity or a breaking news event would conceivably appear frequently over a period of time. In this case, search engine 125 may score documents associated with these search terms (or queries) higher than documents not associated with these terms.

    A further query-based factor may relate to a change over time in the number of search results generated by similar queries. A significant increase in the number of search results generated by similar queries, for example, might indicate a hot topic or breaking news and cause search engine 125 to increase the scores of documents related to such queries.

    Another query-based factor may relate to queries that remain relatively constant over time but lead to results that change over time. For example, a query relating to “world series champion” leads to search results that change over time (e.g., documents relating to a particular team dominate search results in a given year or time of year). This change can be monitored and used to score documents accordingly.

    Yet another query-based factor might relate to the “staleness” of documents returned as search results. The staleness of a document may be based on factors, such as document creation date, anchor growth, traffic, content change, forward/back link growth, etc. For some queries, recent documents are very important (e.g., if searching for Frequently Asked Questions (FAQ) files, the most recent version would be highly desirable). Search engine 125 may learn which queries recent changes are most important for by analyzing which documents in search results are selected by users. More specifically, search engine 125 may consider how often users favor a more recent document that is ranked lower than an older document in the search results. Additionally, if over time a particular document is included in mostly topical queries (e.g., “World Series Champions”) versus more specific queries (e.g., “New York Yankees”), then this query-based factor–by itself or with others mentioned herein–may be used to lower a score for a document that appears to be stale.

    In some situations, a stale document may be considered more favorable than more recent documents. As a result, search engine 125 may consider the extent to which a document is selected over time when generating a score for the document. For example, if for a given query, users over time tend to select a lower ranked, relatively stale, document over a higher ranked, relatively recent document, this may be used by search engine 125 as an indication to adjust a score of the stale document.

    Yet another query-based factor may relate to the extent to which a document appears in results for different queries. In other words, the entropy of queries for one or more documents may be monitored and used as a basis for scoring. For example, if a particular document appears as a hit for a discordant set of queries, this may (though not necessarily) be considered a signal that the document is spam, in which case search engine 125 may score the document relatively lower.

    In summary, search engine 125 may generate (or alter) a score associated with a document based, at least in part, on one or more query-based factors.”

  • Non sò, mi lascia perplesso il punto 4). Se uno sta troppo poco tempo sulla pagina vuol dire che il documento è vecchio? Bah, se ci sto poco è perchè forse non mi interessa, perchè quanto trattato è da approfondire altrove, ma non necessariamente il documento può essere vecchio e di poca importanza.
    Cmq, se lo dicono loro 😀

  • Ciao ‘TagliaErbe’, ciao a tutti.
    Dici di avere ‘semplificato in eccesso’ ma forse è davvero quello che fanno i motori (il motore…) di ricerca.
    Pagina ‘vecchie’, ovvero presenti da un tot di tempo, possono essere considerate stale ‘anche solo se’ non più modificate?
    E’ logico attendersi che il sito acquisisca nuove pagine, ma se di un determinato argomento si è gia parlato, più o meno bene, è ‘necessario’ apportare modifiche o aggiornamenti secondo voi?

    Dare la possibilità di commentare un articolo (proprio come in un blog cms) ‘aiuta’ a rendere la pagina in questione ‘meno stale’?

  • @Felice: si, no tutto ciò che è vecchio è “stale”. Come dice SEO by the SEA qui: http://www.seobythesea.com/?p=1118 , “The Constitution of the United States is an old document, but it’s not stale. A news article about the “World Series” from 1918 may not be what a baseball fan wants to see when searching for “World Series” this October.”

    L’idea di popolare il documento con contenuti generati dall’utente (come i commenti) aiuta sicuramente, ed è probabilmente anche per quel motivo che certi post di certi blog risultato ben piazzati in SERP, anche se si tratta di post “vecchiotti e superati” (ma che magari continuano nel tempo a raccogliere commenti).

  • Ciao a tutti,

    credo che Google controlli tutti e quattro i paramentri segnalati da Taglia, non prendendoli singolarmente quindi.
    Proviamo a simulare un esempio non rispettando le 4 regole contemporaneamente:

    * le pagine più cliccate dagli utenti all’interno delle SERP

    Non clicco mai sulla pagina inquestione: title o description non rispondo alla mia domanda.

    * un buon numero di link, aggiunti costantemente e in modo continuativo nel corso del tempo

    Se non vengono aggiunti link, o forse tolti è perchè non soddisfa più i requisiti o l’interesse.

    * il traffico stabile (o crescente)

    Se non viene cliccato e vengono tolti link, è una conseguenza dei primi punti.

    * un buon tempo di permanenza sul sito

    Ovviamente se nonostante le prime voci non erano utili ma per “sbaglio” clicco sul link, subito uscirò perchè non risponde ai miei interessi.

    In fondo, non mi sembre che sia particolarmente una novità.

    Sempre interessante il tuo blog Taglia!

  • Chiedo scusa, ma non è più semplice mettere un modulo in php che può essere anche un feed reader che “rinfreschi” il contenuto in modo tale da non farla “invecchiare”

    Facile no?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Max Valle

Max Valle

Da oltre 20 anni, fornisco consulenze per aziende e professionisti, che vogliono sviluppare il loro business, 
aumentando i clienti, utilizzando le ultime tecnologie e nel pieno rispetto delle normative vigenti in materia.

Seguimi sui social

Iscriviti alla Newsletter

Main sponsor

Sponsor

Scroll to Top

Utilizziamo i cookie per personalizzare contenuti ed annunci, per fornire funzionalità dei social media e per analizzare il nostro traffico. Condividiamo inoltre informazioni sul modo in cui utilizza il nostro sito con i nostri partner che si occupano di analisi dei dati web, pubblicità e social media, i quali potrebbero combinarle con altre informazioni che ha fornito loro o che hanno raccolto dal suo utilizzo dei loro servizi. Acconsenta ai nostri cookie se continua ad utilizzare il nostro sito web. Per maggiori informazioni visualizza la Privacy & Cookie policy