
Se gestisci solo piccoli siti di 50 paginette massimo, puoi tranquillamente saltare questo post.
Il duplicate content infatti è un fenomeno che può portare a serie punizioni, ma solamente nel caso di grandi portali con decine di migliaia di pagine indicizzate: il problema è proprio che la maggior parte dei proprietari dei siti-portali non si rende conto di generare ogni giorno un numero enorme di contenuti duplicati.
OK, ma l’anti-duplicate è solo un filtro
È vero che il filtro anti-duplicazione ha come funzione principale quella di filtrare dei contenuti uguali tra di loro e quindi far vedere all’utente solamente contenuti unici. Ed è vero anche che nelle piccole dimensioni non porta grosso danno ai proprietari dei siti, filtrando semmai i contenuti ripetuti del nostro sito.
Che cosa succede però quando il nostro sito sta generando più di 1000 pagine al giorno? E cosa succede se su 1.000 pagine 500 contengono il contenuto duplicato? Se il nostro sito inizia a generare mensilmente 15.000 pagine duplicate, questo comincia ad essere un problema perché:
Ora, attenzione: su 10 portali che cominciano l’avventura con il mondo SEO almeno 50% genera le pagine duplicate.
Checklist: 3 cause inconsapevoli del duplicate content
Nel mio piccolo manualetto “Checklist anti-duplicate” (scritto in esclusiva per il TagliaBlog) ho inserito le 3 cause più diffuse che generano (spesso inconsapevolmente) contenuto duplicato.
Basta una semplice occhiata: in 2 minuti capirai se il tuo portale è a rischio di duplicazione di contenuto, oppure se ti sei solo spaventato per niente… magari scopri che il tuo sito è impeccabile e sei tu il vero re della SEO.
Se però sei rimasto ammaliato dalle mie pillole di saggezza e vuoi approfondire l’argomento, puoi ampliare il tuo know how dando un’occhiata al mio corso SEO.
Se invece le tue tasche piangono ma le pagine del tuo portale si stanno duplicando a dismisura, scrivimi pure a michal.gawel@seolab.it: fare due chiacchere è sempre un piacere, e appena avrò un pò di tempo sarò ben felice di aiutarti.
Autore: Michal Gawel di Seo Lab (per TagliaBlog).
13 Risposte
Frederick
Maggio 8th, 2008 at 10:54
1Questo post capita a fagiolo per una domanda che è un po che volevo fare.
Poniamo per esempo di avere un sitarello che vende dei prodotti di Amazon,la descrizione del prodotto copiata da Amazon è considerata contenuto duplicato?
Grazie
Michal (SeoLab)
Maggio 8th, 2008 at 11:08
2Si, e considerata duplicata. In effetti tanti e-commerce,e specialmente questi che vendono i libri affrontano pesanti discorsi di anti-duplicazione:
In effetti per migliaia di prodotti e difficile scrivere delle descrizioni uniche.
Cosi al volo, ti do un paio di soluzioni:
1) Si può mischiare il contenuto duplicato con degli inizi delle descrizioni degli altri prodotti
2) Si può fare la descrizione invisibile per lo spider (attraverso Javascript ad esempio), inserendo invece altro contenuto unico (ad esempio commenti ai prodotti) all’interno della scheda prodotto
3) Siccome nel mercato e-commerce abbiamo spesso da trattare con la concorrenza tra le decine o centinaia dei siti duplicati, oltre a concentrarsi sull’evitare duplicazione, bisogna fare tanto focus sulla affidabilita e popolarita del sito (ricevendo i link, ad esempio attraverso programmi d’affiliazione con buon anchor text). Dalla mia esperienza dare tanto focus alla pagina di prodotto sia on-page che off-page spesso colma discorso di duplicazione, portando nel mentre le visite dagli altri fonti rispetto a Google.
Scusa per l’Italiano, ma essendo Polacco volevo darti una risposta al volo
Pierpaolo
Maggio 8th, 2008 at 11:37
3Salve ho letto l’articolo sui contenuti duplicati: non essendo un esperto di SEO, vorrei farle una domanda.
Innanzitutto però vorrei presentarmi e farle i complimenti per il suo blog, seguito via feed con meticolosa attenzione.
Sulla rete esistono numerosi aggregatori di feed (tutti con meno di un mese di vita) che prendono dal feed i post e li trasformano in articoli veri e propri: ora tralasciando il problema dell’indicizzazione o meno di questi post, non sono un potenziale contenuto duplicato? Io ne ho trovati alcuni che (sicuramente) non hanno il consenso dei blog presi come fonte: aggregator.netsons.org ed altri che non sto qui a citare
Tagliaerbe
Maggio 8th, 2008 at 11:59
4@Pierpaolo: un annetto fa avevo scritto sull’argomento questo post: http://blog.tagliaerbe.com/2007/04/contenuti-duplicati-e-posizionamento.html e, più di recente, anche questo: http://blog.tagliaerbe.com/2008/01/copiatori-di-contenuti-ora-basta.html
Il problema del contenuti duplicati è in effetti grave, e posso confermarti che anche ogni post del TagliaBlog viene sistematicamente clonato in enne “aggregatori” di feed e blog.
Il problema è l’autorevolezza: se hai un blog più “forte” (dal punto di vista del trust) di chi lo clona, non avrai problemi; viceversa, il rischio che i motori di ricerca interpretino il tuo contenuto (originale) come copiato, e quello del “blog copione” come originale, purtroppo c’è…
Pierpaolo
Maggio 8th, 2008 at 12:16
5Il problema potrebbe nascere anche da blog che copiano manualmente: faccio un esempio. Io scrivo di economia, a differenza di molte altre persone scrivo le cose perchè le cose le conosco da vicino, non perchè la materia ha per Google adsense un ecpm accettabile. Per me è più di un blog, è un portfolio lavorativo visitato persino dai miei professori all’università.
Blog che invece penso siano solo di una marea di ragazzini che potrebbero tranquillamente andare a giocare a calcetto, copiano le mie notizie senza uno straccio di fonte. Le fonti a cui attingo sono tutte state richieste ed accettate (poichè collaboro su molti dei siti di cui faccio fonte), lo stesso non accade con me. Trattasi di contenuto duplicato con “accanimento”?
A me sinceramente la cosa comincia a dare fastidio, e non poco. Cosa possiamo fare contro questa marea di ignoranti che copiano post per intero e ledono il lavoro altrui? Te la senti di iniziare una nuova campagna antiplaggio e antiragazzino? Avresti il mio appoggio e presumibilemte quello di tutti i miei amici bloggers. Stavolta senza lasciare scampo a nessuno, facciamo una black list e togliamoci il pensiero. E per l’amor di Dio, diffondiamola!…
Tagliaerbe
Maggio 8th, 2008 at 12:22
6Io sono di questa idea: più un blog diventa “famoso”, più troverai gente che ne saccheggerà i contenuti.
Pertanto, puoi
1) inseguire tutti i copioni (anche a mezzo avvocato) e cercare di far loro eliminare i tuoi contenuti
2) lavorare sul tuo sito/blog strenuamente, con costanza, in modo che il suo trust cresca in modo tale da annientare i copioni
Certo, i 2 punti hanno molte sfumature, ma io rimango dell’idea che la 2) sia la strada migliore.
Se comunque vuoi fare in modo che il “copione” venga eliminato da Google, puoi segnalarlo tramite http://www.google.com/contact/spamreport.html e, se non ottieni risultati, puoi provare a chiedere aiuto qui: http://groups.google.com/group/Google_Webmaster_Help-it (in italiano)
Ai 2 consigli manca solo l’avvocato… ma chi ti dice che fra 1 settimana non esca un altro copione?
Concludendo: fai tutto il possibile per eliminare i copioni (ma senza troppo stress… segnala la cosa a chi di dovere, ma (IMHO) evita l’avvocato, a meno che non ci siano di mezzo motivi gravissimi, diffamazione, o robe simili), e lavora a testa basta sul suo blog, senza troppo badare ai parassiti che ti stanno intorno… che verranno annientati dalla tua stessa fama
Pierpaolo
Maggio 8th, 2008 at 12:30
7La ringrazio, è stato oltre che di conforto, soprattutto utilissimo
Alessandro Cosimetti
Maggio 8th, 2008 at 12:46
8In effetti è una bella “rottura” anche a me sistematicamente copiano i contenuti dei miei posta tali e quali.
In vece in passato facevo un azione autolesionista a mia insaputa.
Ovvero, prendevo il mio post tale e quale e lo “postavo” negli Article Marketing…!
Oggi invece preferisco lavorare soltanto con i social bookmark
Alessandro
Massimiliano
Maggio 10th, 2008 at 13:32
9Mi unisco alle critiche su chi copia contenuti invece di agire di testa propria, sia su blog che su siti web, pur sottoponendo alla vostra attenzione, su un mio sito … pieno di contenuti copiati.
Si tratta di una directory turistica con poco più di 800 strutture inserite. Inserimento gratuito, e pagine dei risultati con nome, descrizione, url, e link diretto verso il sito (a parte un conteggio dei clik).
Naturalmente il mio specifico invito a chi si vuole iscrivere è di inserire nel form contenuti originali ma … il copia incolla è troppo più pratico e veloce …
Considerando poi che
- il sito ha oltre 1400 pagine ad es. hotel/abruzzo/pescara - residence/liguria/genova - cittadarte/puglia/lecce etc. etc. che, pur essendo utili al navigatore (almeno dal mio punto di vista) generano risultati con testi già presenti su altri siti e ripetuti all’interno del mio.
- oltre 10 risultati per pagina conducono a “pagina2″ che ha stesso title e description … e, per alcune categorie le “pagina2″ sono almeno 8/9
- il sito ha un motore di ricerca che restituisce una pagina con risultati, impaginati, tratti sempre dallo stesso db
… quanto sarò penalizzato? … consigli per modifiche? … le pagine hotelsealberghi … non hanno page rank….
In un’altra sottocartella, gira un sito/blog che consente agli utenti di inserire offerte (mi auguro con testi originali….)
Ho appena aggiunto, in una sottocartella, un’altro blog a tema turistico; ci inserirò i miei post … e magari verranno anche commenti e discussioni valide sui temi proposti.
Contribuiranno questi ultimi a migliorare la qualità del sito? E se all’improvviso iniziassero a copiarmi i testi …
Chiudo, così come ho iniziato, criticando la prassi di copiare contenuti con un plagio da ridere su un’altro mio sito …. se siete curiosi
http://www.google.it/search?hl=it&rlz=1G1GGLQ_ITXX248&q=%22chi+%C3%A8+il+consulente+turistico+personale%22&btnG=Cerca&meta=
Nonostante il plagio “differenziato ed adattato” mantengo la prima posizione … (.. ma loro tra i servizi offrono marketing e consulenza legale .. )
Dal post 6. La 2 è la strada migliore (without lawyers)
max
Tagliaerbe
Maggio 10th, 2008 at 17:41
10@Massimiliano:
Alcuni consigli sparsi:
- non prendere testi da altri siti, se non in minima percentuale. Se proprio devi farlo, rielabora i testi di tuo pugno, modificandoli almeno in parte;
- fai in modo di avere title e description sempre diversi su tutte le pagine;
- se ti capita di generare tuo malgrado pagine con contenuti in massima parte duplicati, eliminale via robots.txt;
- lavora sempre con costanza a migliorare ed arricchire il tuo sito: se il tuo trust sale, i copioni non potranno farti (quasi) nulla.
Contenuti Duplicati: Come Scoprire Le Cause | MondoBlog
Maggio 12th, 2008 at 12:32
11[…] Davide Pozzi parla dei contenuti duplicati, un fenomeno che può portare a serie punizioni da parte di Google. “Il duplicate content infatti è un fenomeno che può portare a serie punizioni, ma solamente nel caso di grandi portali con decine di migliaia di pagine indicizzate: il problema è proprio che la maggior parte dei proprietari dei siti-portali non si rende conto di generare ogni giorno un numero enorme di contenuti duplicati.” […]
fra_975
Maggio 13th, 2008 at 13:29
12Sempre ottimi post!complimenti!visto che siamo in tema domando se sono considerati contenuti duplicati le versioni inglesi sui vari domini di nazionalità inglese che il cliente di un grosso portale ha acquistato. Ovvero la versione in lingua inglese del portale compare su miosito.com,miosito.co.uk, miosito.ca eccetera.
Non so se sia meglio mettere un 301 su tutti i domini di lingua inglese al dominio.com e perdere una migliore possibilità di comparire nelle versioni specifiche del motore?
sono nel dubbio…
ciao ciao
francesca
Wordpress: addio! (dai meta tag) | Cabrino Simone’s Blog
Maggio 14th, 2008 at 01:09
13[…] (da noi ipotizzati e poi confermati), indicizzando anche le stesse query, creando nel contempo contenuti […]
RSS dei commenti per questo post · TrackBack URI
Lascia un commento
Sponsor
MyBlogLog
Criteo Autoroll
Archivi
post recenti
commenti recenti
i più commentati
Il TagliaBlog è realizzato su piattaforma WordPress - il tema di base è BloggingPro ed è stato modificato da Mirko D'Isidoro di Blographik.it