,

Comprendre, éviter et corriger le contenu en double

Mise à jour le

Comment vérifier le contenu dupliqué ?

Pour les professionnels du référencement naturel, les problèmes entourant le contenu dupliqué ainsi que le contenu de mauvaise qualité, peuvent être catastrophiques pour se positionner dans les moteurs de recherche. Comme Google, Bing et d’autres moteurs de recherche deviennent de plus en plus sophistiqués, ils positionnent dans les meilleures positions seulement les sites qui ont du contenu de qualité et du contenu unique. Dans cet article, nous allons voir comment vérifier si votre contenu est dupliqué.

Qu’est-ce que le contenu dupliqué ?

En termes de référencement naturel, le contenu dupliqué ou contenu en double se réfère à un morceau de texte sur une page Web qui est exactement le même ou qui est très similaire à un texte présent sur une autre page Web qui est ou non sur votre propre site web.

Les moteurs de recherche n’aiment pas le contenu en double et lorsque Google marque une page Web comme étant « dupliquée », cette page spécifique va probablement être déclassée dans les résultats de recherche. En fait, s’il est difficile pour un moteur de recherche de déterminer quelle page entre deux ou plus est la source d’origine, toutes les pages incriminées peuvent être considérées comme des doublons.

Pourquoi se prémunir du contenu dupliqué est-il important pour le référencement ?

L’objectif principal de Google est de fournir aux utilisateurs des résultats de recherche les plus pertinents. C’est pourquoi il essaie toujours d’indexer et d’afficher des pages avec des informations utiles et différentes. Lorsque Google fait face à deux URL avec un contenu similaire, il doit décider lequel afficher dans les résultats de recherche et celui à interpréter comme étant une copie. Cela n’a peut-être pas d’impact immédiat, mais un problème de duplication de contenu peut être pénalisant pour un site Web et dans le pire des cas, entraîner une pénalité de la part de Google.

Une autre conséquence d’une page Web qui accessible via plusieurs URL est que la popularité de la page est divisée. La popularité de la page ou la qualité est un facteur de classement important pour Google, plus la popularité est faible, moins les possibilités d’un bon classement sont élevé.

Comment puis-je éviter le contenu dupliqué ?

Lorsque vous concevez votre site Web, essayez d’être cohérent avec sa structure et les liens internes. Gardez à l’esprit le problème de duplication du contenu dès le début et essayez de prévoir la création possible de plusieurs URL lors de la configuration de la structure dans le système de gestion de contenu. Evitez par exemple différentes terminaisons d’URL avec ou sans « / » ou « .html ». Choisissez une option et respectez-la.

La plupart du temps, vous ne serez pas en mesure d’éviter ou de prévoir tous les risques liés au contenu. C’est pourquoi il est logique, une fois qu’un site web est lancé, de le vérifier périodiquement pour d’éventuels problèmes de contenu.

Comment vérifier le contenu en double ?

Si votre site Web est déjà en ligne, la première étape consiste à déterminer s’il contient plusieurs URL avec le même contenu ou non. Il existe de nombreux outils et moyens de le faire. Un très bon outil de vérification de contenu en double pour explorer l’ensemble de votre site Web est Screaming Frog. Cet outil de crawl vous fournit une liste complète de toutes les URL que Google peut trouver sur votre site Web, avec la possibilité d’exporter les informations pour les analyser.

Un autre moyen de vérifier le contenu en double consiste à utiliser Search Console de Google. Si vous vérifiez sous Apparence de la recherche > Améliorations HTML, il vous montre plusieurs points de contenu dupliqué sur le site par exemple des titles ou des méta-descriptions identiques.

Qu’est-ce que la canonisation et comment puis-je résoudre ce problème ?

La canonique est le processus de définition de l’URL correcte parmi les options disponibles. Lorsque Google «canonise» une URL, il essaie de choisir le meilleur représentant parmi l’ensemble des URL.

Une fois que vous avez identifié les URL avec le contenu en double, il existe un moyen facile de résoudre ce problème. La première option consisterait toujours à supprimer l’URL qui affiche le contenu en double. Parfois cela est impossible pour des raisons techniques. La deuxième option consisterait à configurer la canonisation avec l’élément de lien canonique rel = « canonical » qui indique l’URL correcte. Cet élément est à placer dans la section <head> des pages qui ont le contenu dupliqué.

De cette façon, Google sait quelle URL est la bonne et laquelle devrait être traitée comme une copie. En outre, en mettant en place un lien canonique, l’autorité du lien est transmise à l’URL correcte.

Une erreur de canonisation commune consiste à créer une boucle infinie entre plusieurs URL en raison d’une implémentation incorrecte. Pour éviter cela, il est recommandé que la mise en œuvre des balises canonical soient faite ou guidée par un expert dans ce domaine.

Vérifier manuellement le contenu en double

CopyScape et Siteliner sont des outils de contrôle de contenu dupliqués sympas et faciles à utiliser. Cependant, si vous voulez voir ce qui est en double selon Google, vous pouvez également utiliser Google lui-même.

Si vous avez une page que vous souhaitez vérifier, allez simplement sur cette page. Copiez un extrait de texte. Insérez l’extrait exact dans Google en utilisant des guillemets doubles comme ceci :

« Votre parfum de glace préféré est sûrement la vanille. Si vous préférez la glace à la fraise, alors vous devez être tolérant, loyal et introverti ».

Limitez cette phrase à une trentaine de mots, car Google ne prendra en compte qu’une trentaine mots. Cette requête de recherche renvoie «environ 8 résultats» selon Google.

Outils en ligne de vérification de contenu dupliqué

Copyscape : il permet de contrôler le contenu dupliqué sur le web

Premier sur la liste est Copyscape, qui est l’un de nos outils favoris et le plus précis pour vérifier le contenu dupliqué disponible sur le web et son utilisation est gratuite. C’est l’un des vérificateurs de plagiat les plus anciens et les plus populaires.

Copyscape fournit un service gratuit qui permet de rechercher facilement le plagiat sur le web et d’identifier les cas de vol de contenu. Tapez simplement l’URL de votre contenu original et Copyscape fait le reste. Bien que, l’outil est libre mais l’utilisation quotidienne est limitée à quelques recherches par utilisateur.

Il offre également des services professionnels pour des besoins plus avancés. Si vous avez un volume important de contenu, vous pouvez vous inscrire aux services premium de Copyscape, puis intégrer leur API dans votre CMS pour identifier facilement le contenu dupliqué.

Positeo : un outil français qui permet de checker le contenu dupliqué sur le web

Cet outil pour checker le contenu qui est dupliqué sur le web est gratuit. Positéo permet de découvrir à partir d’une URL ou d’un texte les contenus qui sont dupliqués sur votre site ou sur d’autres sites sur le web.

L’outil a l’atout majeur de présenter les résultats de manière très claire en affichant les sites susceptibles d’avoir copié votre propre contenu, et en précisant le taux de duplication.

L’outil utilise l’API Google pour effectuer les recherches et réaliser l’analyse du duplicate content. Simple, sympa et plutôt efficace en première approche…

Siteliner : il permet de contrôler le contenu dupliqué sur un site web

On aime vraiment cet outil, en plus de contrôler le contenu en double qui se trouve sur votre site, il fournit également une analyse complète du site Web une fois par mois. Siteliner est un service gratuit de Copyscape qui vous permet d’explorer votre site Web, en révélant les principaux problèmes qui affectent la qualité de votre site et les classements des moteurs de recherche.

Siteliner peut vérifier le contenu en double, les liens brisés, la puissance de la page et il génère un rapport complet après l’analyse de votre site. Celle-ci révèle de bonnes informations qui peuvent finalement vous aider à améliorer votre site web ou blog.

Bien que le service Siteliner soit gratuit, il est limité à des analyses mensuelles de 250 pages maximum, cela est plus que suffisant pour un site web de petite taille ou même de taille moyenne.


Publié

dans

,

par

Étiquettes :