Le référencement et le Duplicate Content.

Qu’est-ce que le référencement ? À quoi ça sert ? Qu’est-ce que le duplicate content ? Comment l’éviter ? Vous êtes au bon endroit pour tout comprendre sur le référencement et le duplicate content !

Commençons par rappeler ce qu’est le référencement ?

Le référencement est un sujet vaste avec énormément de chose à dire. Il correspond à l’ensemble des techniques utilisées pour améliorer le positionnement de votre site internet sur le web. Une agence de référencement vous expliquera que le référencement peut être naturel (utilise des actions stratégiques pour rendre votre site le plus haut possible dans les résultats naturels des moteurs de recherche), ou payant (utilise des liens sponsorisés Adwords ou mots clés payants pour se positionner dans les premiers résultats des moteurs de recherche).

Qu’est ce que le Duplicate Content ?

En français, on parle de contenu dupliqué. Cela correspond au fait de trouver un même contenu sur 2 pages web (ou plus) différentes appartenant ou non au même site. Si ce contenu est présent sur plusieurs sites web différents, on parle de plagiat. Le duplicate content est un  fléau, qui pénalise le positionnement d’un grand nombre de sites internet, c’est pourquoi il est important de veiller à l’éviter.

Il existe 2 types de duplicate content :

  • Le duplicate content interne (ou intrasite) : Tout comme son nom l’indique, il correspond à tout type de contenu présent plusieurs fois au sein d’un même site. Cette pratique peut être volontaire ou involontaire.
  • Le duplicate content externe (ou extrasite) : Elle découle d’un contenu présent sur plusieurs sites différents, autrement dit du plagiat.
duplicate content

duplicate content

Le plagiat ? Que signifie ce mot ? Quels sont les risques ?

Le plagiat correspond comme souligné précédemment, au fait de recopier en totalité ou presque, des contenus venant d’autres pages. Cette pratique peut entraîner des sanctions…

Exemple : “Vous adorez un article sur les crêpes sucrées, donc vous copiez-collez cet article sur votre site web en changeant le titre de l’article “Crêpes sucrées” par “Crêpes salées”. Cela est très mauvais pour le SEO. Google va vous infliger des pénalités, car considéré comme du vol de contenu !

Mais attention, il y a quelques cas exceptionnels ou le plagiat est toléré notamment pour les sites e-commerce !

Exemple : « Vous vendez des montres sur internet et vous devez rédiger une description sur chaque montre. Google repère que c’est un site de vente en ligne de montres. Vous pouvez donc copiez-collez certains textes et structure de site »  

Nous avons sélectionné pour vous, 5 outils gratuits anti-plagiats à utiliser :

  1. Copyscape
  2. Positeo
  3. Duplicate Content Checker
  4. Quetext
  5. Plagiarism

Pourquoi faut-il éviter le duplicate content ?

Il est important d’éviter le contenu dupliqué dans votre stratégie de référencement pour 2 raisons principales :

 

Tout d’abord, par rapport à Google Panda, ce trackeur du web contrôle les sites qui font du plagiat et celui-ci fait également la chasse aux mauvais référenceurs. En d’autres termes, il peut sanctionner vos pages web.

 

seo duplicate content

seo duplicate content

Voici quelques exemples de pénalités :

 

  • Désindexation de votre (s) page(s) web(s) : Votre page disparaît partiellement des résultats naturels des moteurs de recherche.
  • Court déclassement de la (les) page(s) : Votre page perd des places dans le classement des résultats naturels des moteurs de recherche.
  • Un déclassement de tous les sites web concernés: En effet, il est difficile pour Google de repérer le site original et le site qui a dupliqué du contenu. Ce cas se présente lorsque le site frauduleux bénéficie d’une PageRank plus importante ou du moins d’une valeur mieux estimée que le site source. Les robots protègent alors le site qui semble être le plus populaire et honnête.

 

Ce Duplicate Content, peut dégrader l’image de votre site. En effet, il est désagréable pour une personne de constater que le contenu apporté est répété plusieurs fois dans différents articles ou même pire, que ce contenu provient en fait d’un autre site. Cette situation peut provoquer une mauvaise expérience client et nuire à votre réputation.

Comment l’éviter ?

Pour éviter d’avoir du contenu dupliqué, quelques bonnes pratiques sont à adopter :

Au niveau du contenu interne :

 

  • Évitez de faire du copier/coller de vos contenus et explorez régulièrement les différentes pages de votre site afin de surveiller d’éventuelles duplications de contenus involontaires.
  • Consultez régulièrement Google Webmaster Tools, ce support vous indiquera les cas de contenus dupliqués détectés sur votre site web.
  • Utilisez des Titles et Méta descriptions spécifiques à chaque page

Au niveau du contenu externe :

  • Vérifier également si d’autres sites ont dupliqué votre contenu. Pour se faire, rien de plus simple, copier/coller certains passages de vos pages sur Google et vérifiez que certains sites ne vous ont pas copié.
  • Si vous effectuez une restructuration de votre site, veillez à utiliser des redirections 301 « Redirect Permanent » de vos pages afin de renvoyer vos internautes et les moteurs de recherche vers les nouvelles urls et éviter les duplicates contents.
  • En cas de plagiat, faites valoir vos droits en demandant au propriétaire du site la suppression du contenu en question et si aucune réponse ne vous arrive, utilisez l’outil de plainte :  Google désindexation

Voici 2 exemples de duplicate content pouvant se heurter à vous :

Problème 1 : Du contenu dupliqué sur des sites “Partenaires”

 

Le problème avec le Duplicate Content arrive très rapidement quand un même contenu se trouve sur des sites différents. Exemple type : une dépêche AFP qui va se retrouver sur un site de l’agence presse qui l’a conçue mais aussi sur d’autres sites web dit “officiels” qui la reprennent.

 

Par exemple : Un site web de contenu propose un article en ligne sur un sujet donné (mode, décoration, voyage, sport…) et cet article est repris par un site Web partenaire, qui a signé un contrat pour avoir le droit de reprendre ce contenu.

 

Google sait très bien extraire le contenu réel dit éditorial d’une page Web et mettre appart la partie que l’on nomme plutôt “Navigation et charte Graphique” du code HTML.

 

Une fois ce travail effectué sur les deux pages contenant l’article, il aura deux textes identiques. Une question se pose alors…Quelle version va-t-il prendre en compte ? Ce n’est pas une question facile…Google prendra comme page canonique, celle qu’il a trouvée en premier et ayant le plus fort PageRank, en d’autre terme, celle qui est la plus “populaire”.

 

C’est alors le rôle de Google de reconnaître quel est le contenu original et celui qui est dupliqué. Pour cela il existe une solution : demander à vos partenaires si vous êtes le propriétaire du contenu canonique (original) et demander de mettre un lien, si ce n’est pas déjà fait, sur leurs pages dupliquées, vers votre page canonique

Problème 2 : Du contenu dupliqué sur des sites dit “Pirates”

Le problème de Duplicate Content se pose également si votre contenu est repris par des sites qui ne sont pas vos partenaires. Il sera alors encore plus énervant pour vous de voir l’un de ces contenus s’afficher en bonne position sur votre moteur de recherche favori, alors que le vôtre est passé dans les filtres du duplicate Content.

 

La solution ?

 

  • Privilégier une approche « Amiable » : en trouvant l’adresse e-mail du responsable du site “pirate” pour lui signifier que votre contenu est soumis à Copyright et qu’il n’a pas le droit de le reprendre ainsi.
  • Dans le cas ou cette approche “Amiable” ne marche pas, il faudra faire constater la fraude par un Avocat et durcir le ton !

 

Il vous faudra tenter de recevoir le plus de backlinks possible de la part de l’éditeur de site web reprenant votre contenu. Les moteurs vont trouver et identifier ces liens et comprendre ainsi que c’est le vôtre qui est l’original, et non celui des pirates qui, eux, n’auront pas de rétrolien à proposer. C’est alors la page qui aura la plus forte popularité (PageRank), par l’analyse des liens émanant des pages dupliquées, qui sera retenue par le moteur.

Pour finir, quelques liens sur la notion de duplicate content

Voici quelques liens qui nous ont semblé intéressants dans le cadre d’une stratégie de lutte contre le duplicate content. Nous vous laissons découvrir notre sélection.

 

  • Detecting Duplicate and Near-Duplicate Files (brevet de Google)
  • Understanding SEO Issues Related to Duplicate Content (SEO Guide)
  • The Illustrated Guide To Duplicate Content in the Search Engines (seomoz)

 

Laura :

« J’aime manger des pop corn en pyjama devant un bon film avec mon plaid mickey »

« Je n’aime pas me lever à 15h déboussolée après une soirée arrosée et réaliser que ma journée est déjà finie … »

Marie :

« J’aime manger quotidiennement des légumes et des fruits issus de l’agriculture biologique, tout en allant au MacDonald’s une fois par semaine… »

« Je n’aime pas oublier mon mot de passe pour me connecter à mon site référencements-gones.com, alors que je viens de le modifier… »

Margaux :

« J’aime rentrer dans le Corsica Ferries à 23h à Toulon, et en sortir à 7h, à peine éveillée en découvrant l’île de Beauté. »

« Je n’aime pas entendre tous les matins à la même heure, mon voisin du dessus, papi Daviot, 90 ans, faire pipi à 6h23 du matin »

Vous pouvez partager cet article :