Comment supprimer les spams référents des rapports analytics ?

Mise à jour le

Comment supprimer les spams référents des rapports analytics

Ça fait plusieurs semaines, voir même des mois que nos comptes Google Analytics sont victime de spammeurs qui viennent fausser les données. En effet, les rapports Analytics affichent ainsi des sites référents tels que free-social-buttons.com, theguardlan.com ou encore ilovevitaly.com et la liste est longue ! Nous allons voir comment exclure ces données de nos rapports.

A quoi sert ce spam référent ?

Personnellement ce spam ne me sert à rien à part fausser mes données, pour les spammeurs c’est complètement différent. Si comme moi, la première fois vous avez été curieux d’aller voir quel site web vous envoyait du trafic, c’est que le spammeur a réussi son coup. Ils utilisent cette technique pour attirer des visites rétroactives en simulant une source de trafic à une cible. Si ce spammeur a souscrit à une plateforme d’affiliation, il va rediriger le trafic vers un lien d’affiliation qui va se transformer en argent pour lui. Ils sont malins quand même !

Exemple :

Dans mes sources de trafic, j’ai theguardlan.com comme site référent. Je copie/colle cette URL dans mon navigateur et je suis tout de suite redirigé vers le site Aliexpress avec une URL d’affiliation tel que http://www.aliexpress.com/aff_platform=aaf&sk=yNz3bMJiy%3A&cpt = 1434479016049&aff_trace_key=26406543342955168.

Cette technique rapporte beaucoup d’argent au spammeurs. En effet, leurs robots vont laisser des traces sur des centaines de millions de site web pour ainsi générer des millions de visites sur Aliexpress, Amazon ou tout autres site web proposant de l’affiliation afin de tout transformer en argent.

Comment procède-il ?

4 étapes sont nécessaires pour mettre en place une telle pratique :

  1. Le spammeur souscrit à un programme d’affiliation dont le seul but est de toucher une commission pour chaque vente qu’il aura généré.
  2. Le spammeur crée ensuite un site web où il mettra en place une redirection vers le site web ou le produit sur lequel il percevra une commission.
  3. Le spammeur met en place un automate qui sera chargé d’injecter des données dans Google Analytics, dont l’adresse de son site web.
  4. Vous tombez dans son piège et vous visitez son site web qui vous redirige vers Aliexpress par exemple. Au passage, un cookie est déposé sur votre navigateur pour que la plateforme d’affiliation identifie le partenaire qui vous a envoyé. Ce cookie est valable 24 heures, donc si vous effectuez un achat sur Aliexpress (pour garder notre exemple) dans les 24 heures qui suivent, le spammeur touchera une commission.

Comment accèdent-ils à votre compte Analytics ?

Pas de panique, aucuns robots n’explorent votre site web. Pour inscrire leur info dans votre Analytics, les spammeurs se servent du Measurement Protocol de Google. La seule chose dont ils ont besoin est l’ID de suivi de votre compte Analytics et c’est tout ! Les références, les pages, les noms d’hôtes, mots-clés,… sont injectés par eux.

Pour obtenir les identifiants, les spammeurs génèrent aléatoirement les codes (type UA-XXXXXX-X), ensuite avec un script automatisé, ils envoient de fausses données à nos rapports.

L’unique façon d’arrêter ce spam est de mettre en place des filtres. Il est très important de ne pas utiliser l’exclusion des sites référents ! Sinon de cette façon les spams référent vont disparaître du trafic référent mais seront transformé en trafic direct par Analytics. Vous aurez simplement déplacé le problème ! Une technique consiste d’essayer de les bloquer avec le fichier .htaccess de votre site web. Le fichier .htaccess permet de contrôler ceux qui accèdent à votre site web, mais comme nous le savons, les spammeurs n’ont jamais atteint votre site web.

Comment se débarrasser du spam référents ?

Pour bloquer ces spammeurs, les filtres vont nous être utiles. Il est important de savoir que les filtres ne vont pas agir sur les rapports des jours, semaines et mois passés. Les filtres que nous allons voir agiront que sur les prochaines données. Il est toutefois possible de se débarrasser des spams référents présent dans l’historique de vos données avec les segments avancés.

Avec Google Analytics il est de bonne pratique de toujours conserver une vue non filtrée sur lequel aucun filtre ne sera configuré. Si au moment de la configuration des filtres une erreur est commise, vous aurez toujours accès à votre historique.

Personnellement j’ai créé 3 filtres :

  1. Une vue non filtrée
  2. Une vue filtrée
  3. Une vue test

Crée un filtre sur le nom d’hôte

Dans Google Analytics, le nom d’hôte représente votre nom de domaine. Toutes les données envoyées à Google Analytics depuis votre site web sont associés au nom d’hôte. Comme les spammeurs génèrent aléatoirement les ID, ils ne connaissent pas votre nom de domaine. Généralement dans ce cas de figure, les données sont vides ou égale au nom de domaine du spammeur.

Pour retirer presque la totalité du spam référent des rapports, la création d’un filtre sur votre nom d’hôtes est nécessaire. Pour le configurer, suivez ces étapes :

Allez dans Admin de Google Analytics > sélectionnez la vue à filtrer (a) > cliquez sur Filtres (b)


Ensuite cliquez sur le bouton rouge  

Le filtre que nous allons créer va se baser uniquement sur le nom d’hôte.

Attention : si des données remontent sur votre compte depuis plusieurs domaines (prestataire de paiement e-commerce, blog hébergé sur un autre domaine, chaîne Youtube etc…) il faudra utiliser les expressions régulières afin de bien inclure tous vos domaines grâce à ce filtre.

Pour avoir un aperçu des données qui seront exclu, cliquez sur « Vérifier ce filtre » et alors un tableau comme ci-dessous devra s’afficher.

Ensuite nous allons activer l’option de filtrage des robots connus sur toutes vos vues Google Analytics (Admin > Vue > Paramètres de la vue)

Et cochez la case « Filtrage des robots »

Pour le moment ce filtrage ne permet pas d’exclure ces spams mais avec le temps, j’espère que Google va arranger ça !

Pour optimiser au mieux vos données, nous allons exclure les crawlers qui visitent votre site avec de nouveau des filtres.

Contrairement au filtre que nous avons mis en place sur le nom d’hôte de l’étape (b) qui est propre pour chaque site, le filtre que nous allons créer sera sur le compte entier. Ce filtre sera étendu sur l’ensemble des sites web du compte Google Analytics.

Cliquez ensuite sur le bouton  et donnez un nom au filtre

Ce filtre va nous permettre d’exclure tous les noms de domaines spammy qui sont présent dans les rapports de Google Analytics.

Si vous avez suivi à la lettre ces configurations, vous devriez constater rapidement un retour à la normale. Les spammeurs évoluent constamment, vous devez alors faire attention à mettre à jour vos filtres en attendant que Google réagisse face aux spams référent.

Comment débarrasser son historique des spams référents avec la segmentation ?

Pour purifier l’historique de vos donnez, dans votre vue principale, cliquez sur « Ajouter un segment »

Une fenêtre apparaît répertoriant tous les segments disponibles. Cliquez sur « Nouveau« .

  • Donnez-lui un nom du type « Elimine le spam »
  • Dans la partie « Avancée », choisissez un segment de type « Conditions »
  • Créez ensuite filtre de nom d’hôte de type « Inclure »
  • Saisissez une expression régulière pour vos noms d’hôtes

Nous allons créer un second filtre pour exclure les crawlers qui restent :

  • Cliquez sur Ajouter un filtre de façon à exclure les sources des crawlers
  • Choisissez « Sessions », puis « Exclure
  • Ensuite choisissez « Source » et « contient »
  • Et entrez une liste de sources de spam de référence, séparées par la barre verticale (|)

Pour info, ma dernière liste (01/07/2015) ressemble à ca :

semalt|anticrawler|best-seo-offer|best-seo-solution|buttons-for-website|buttons-for-your-website|7makemoneyonline
-musicas*-gratis|kambasoft|savetubevideo|ranksonic|medispainstitute|offers.bycontext|100dollars-seo|sitevaluation|
dailyrank

Le filtre étant limité en caractère, vous devrez surement en ajouter un supplémentaire. Enregistrez ce segment et retournez dans vos rapports, les données affichées sont normalement propres et vous pouvez donc travailler sur un historique qui ne contient pas de spam.

Cet technique pour supprimer le spam d’analytics à aider un consultant SEO à Montpellier donc j’espère qu’il vous aidera à en finir avec le spam référent.


Publié

dans

par

Étiquettes :