Qu'est-ce que le contenu dupliqué ? - Refeo.com

Qu’est-ce que le contenu dupliqué ?

Pour se mettre d’accord sur ce dont on parle !

Le contenu dupliqué est d’abord le résultat d’une interprétation par un moteur de recherche de l’existence sur une autre page d’un contenu proche. Par contenu, il faut principalement comprendre les textes d’un site, vu qu’il s’agit de ce que les moteurs analysent prioritairement. Si le contenu d’une page A existe en grande partie aussi sur une page B alors on parle de contenu dupliqué.
La question fondamentale est de savoir à partir de quel degré de proximité dans les textes un contenu devient dupliqué. Évidemment un copié-collé de plusieurs centaines de mots sans aucun autre texte original sur une page produit du contenu dupliqué. Maintenant, que se passe-t-il si je change par des synonymes certains mots, si je change l’ordre des paragraphes, le formatage (gras, italique, etc) ? Difficile de répondre avec précision à cette question. Je pense que ces quelques modifications sont insuffisantes, que le moteur analyse les données avec un seuil de tolérance et que de simples tours de passe-passe ne suffisent pas à le tromper. J’ai eu un jour un débat téléphonique avec un annuairiste (c’est le propriétaire d’un annuaire en ligne) qui me soutenait qu’une simple suite de six mots identiques pouvait faire passer une page entière en contenu dupliqué. Je n’adhère pas à ce point de vue, je pense qu’il en faut plus pour devenir dupliqué, mais cela vous donne une idée de la peur que génère cette problématique.

Info bonus

Si vous envisagez un peu la problématique du contenu dupliqué côté moteur, vous comprendrez aussi la complexité technique sous-jacente : pour chaque page vue par un moteur, celui-ci doit digérer le contenu pour ensuite le comparer à toutes les autres pages déjà connues. En terme de puissance de calcul, c’est exponentiel et infaisable si vous n’optimisez pas le process… Alors comment font Google et les autres ? Rien d’officiel mais on peut penser que les moteurs réalisent une signature du contenu sur quelques octets (en langage plus clair : compriment le contenu de la page analysée sous forme d’une série de caractères) pour ensuite comparer non pas la page entière mais « simplement » les signatures entre elles. En construisant une signature ad hoc, les ressources consommées diminuent drastiquement et rendent le process possible. C’est à ce jour l’hypothèse la plus plausible sur la façon dont les moteurs résolvent ce casse-tête technologique !

Exemple concret

Le piège classique en contenu dupliqué est l’intégration de fiches produits sur un site e-commerce : par ignorance du problème et manque de temps, les e-commerçants copient et collent le contenu de leur fiche produit (d’un produit à l’autre ou depuis le fichier du fournisseur). C’est une erreur majeure car au final,les pages importantes du site sont perçues comme dupliquées soit au sein même du site soit d’un site à l’autre (un concurrent qui vend les mêmes produits).
La solution ? Vous devez rédiger pour chaque page produit une description unique. Et comme ce sera lu par vos clients,vous devez aussi faire un vrai effort rédactionnel sous peine de faire fuir vos prospects !

Le résumé utile

Le contenu dupliqué est tout ou partie d’un texte qui existe déjà sur une autre page du site ou ailleurs.
duplicate-content

Follow

A propos de l'auteur

Je suis consultant indépendant en AdWords et SEO depuis plus de 10 ans. J'ai investi pour le compte de mes clients plus de 3 000 000 € de clics sur Google. Je suis auteur l'auteur du livre Trouvez des Clients avec AdWords. Bonne lecture !