Arrêtez-Esprit Spam dans Google Analytics avec un filtre

Le spam dans Google Analytics (GA) est en train de devenir un grave problème. En raison d'un déluge de renvoi du spam à partir des boutons sociaux, les sites pour adultes, et beaucoup, beaucoup d' autres sources, les gens commencent à être submergés par tous les filtres , ils sont la mise en place pour gérer les données inutiles qu'ils reçoivent.

Les bonnes nouvelles sont, il n'y a pas lieu de paniquer. Dans ce post, je vais me concentrer sur les erreurs les plus communes que les gens font quand la lutte contre le spam dans les GA, et expliquer un moyen efficace de prévenir.

Mais d'abord, nous allons nous assurer que nous comprenons comment fonctionne le spam. Il y a quelques mois, Jared Gardner a écrit un excellent article expliquant ce qu'est le spam référence est, y compris sa destination. Il a également souligné quelques grands exemples de référence spam.

Types de spam

Le spam dans Google Analytics peut être classé par deux types: les fantômes et les robots.

Des fantômes

La grande majorité du spam est ce type. Ils sont appelés fantômes parce qu'ils n'accèdent à votre site. Il est important de garder cela à l'esprit, car il est essentiel à la création d'une solution plus efficace pour gérer le spam.

Comme inhabituel que cela puisse paraître, ce type de spam n'a pas d'interaction avec votre site à tous. Vous pouvez vous demander comment cela est possible puisque l'un des principaux objectifs de GA est de suivre les visites de nos sites.

Ils le font en utilisant le protocole de mesure, ce qui permet aux gens d'envoyer des données directement vers les serveurs de Google Analytics. En utilisant cette méthode, et des codes de suivi probablement générés au hasard (UA-XXXXX-1), ainsi, les spammeurs laisser un "visite" avec des données fausses, sans même savoir qui ils frappent.

Crawlers

Ce type de spam, à l'opposé de fantôme spam, fait accéder à votre site. Comme son nom l'indique, ces robots collecteurs de mails rampent vos pages, en ignorant les règles comme ceux qu'on trouve dans le fichier robots.txt qui sont censés les empêcher de lire votre site. Quand ils quittent votre site, ils laissent un dossier sur vos rapports qui apparaît semblable à une visite légitime.

Crawlers sont plus difficiles à identifier car ils savent que leurs cibles et utilisent des données réelles. Mais il est vrai aussi que de nouvelles apparaissent rarement. Donc, si vous détectez un renvoi dans votre analyse qui semble suspect, la recherche sur Google ou le contrôle contre cette liste pourrait vous aider à répondre à la question de savoir si elle est ou non spammy.

La plupart des erreurs courantes faites lorsqu'ils traitent avec le spam dans GA

J'ai suivi de près cette question au cours des derniers mois. Selon les commentaires des gens sur mes articles et des conversations que j'ai trouvé dans les forums de discussion, il y a principalement trois erreurs les gens font lorsqu'ils traitent avec le spam dans Google Analytics.

Erreur # 1. Blocage fantôme du spam à partir du fichier .htaccess

Une des plus grandes erreurs que les gens font est d'essayer de bloquer fantôme spam à partir du fichier .htaccess.

Pour ceux qui ne sont pas familiers avec ce fichier, l'une de ses principales fonctions est de permettre l'accès / bloc à votre site. Maintenant, nous savons que les fantômes ne jamais atteindre votre site, afin de les ajouter ici n'aura aucun effet et ne pourront ajouter des lignes inutiles à votre fichier .htaccess.

Fantôme de spam apparaît généralement pendant quelques jours, puis disparaît. En conséquence, parfois les gens pensent qu'ils ont bloqué avec succès à partir d'ici quand vraiment il est juste une coïncidence de calendrier.

Puis, quand les spammeurs reviennent plus tard, ils obtiennent inquiet parce que la solution ne fonctionne plus, et ils pensent que le spammeur en quelque sorte contourné les obstacles qu'ils mettent en place.

La vérité est, le fichier .htaccess ne peut effectivement bloquer les robots tels que buttons-for-website.com et quelques autres puisque ceux-ci accèdent à votre site. La plupart des spams ne peut être bloquée en utilisant cette méthode, il n'y a donc pas d'autre choix que d'utiliser les filtres pour les exclure.

Erreur # 2. Utilisation de la liste d'exclusion renvoi à arrêter le spam

Une autre erreur est d'essayer d'utiliser la liste d'exclusion de référence pour arrêter le spam. Le nom peut vous confondre, mais cette liste ne vise pas à exclure les références dans la façon dont nous voulons pour le spam. Il a d'autres fins.

Par exemple, quand un client achète quelque chose, parfois, ils sont redirigés vers une page tierce partie pour le paiement. Après avoir effectué un paiement, ils sont redirigés vers votre site, et GA enregistre que comme une nouvelle référence. Il convient d'utiliser la liste d'exclusion pour empêcher le renvoi que cela se produise.

Si vous essayez d'utiliser la liste d'exclusion de référence pour gérer le spam, cependant, la partie de référence sera dépouillé car il n'y a pas d'enregistrement préexistant. En conséquence, une visite directe sera enregistrée, et vous aurez un problème plus grand que celui que vous avez commencé avec depuis. Vous aurez toujours le spam, et les visites directes sont plus difficiles à suivre.

Erreur # 3. Inquiétant que les changements de taux de rebond aura une incidence sur le classement

Quand les gens voient que les changements de taux de rebond considérablement à cause du spam, ils commencent à se soucier de l'impact que cela aura sur leur classement dans les SERPs.

Ceci est une autre erreur souvent faite. Avec ou sans spam, Google ne prend pas en considération les mesures de Google Analytics en tant que facteur de classement. Voici une explication à ce sujet de Matt Cutts, l'ancien chef du spam web de l'équipe de Google.

Et si vous pensez à ce sujet, l'explication Cutts est logique; parce que bien que beaucoup de gens ont GA, pas tout le monde utilise.

En supposant que votre site a été piraté

Une autre préoccupation commune quand les gens voient des pages d'atterrissage étranges venant de spam sur leurs rapports est qu'ils ont été piratés.

n'existe pas La page que le Spam montre sur les rapports, et si vous essayez de l'ouvrir, vous obtiendrez une page 404. Votre site n'a pas été compromise.

Mais vous devez vous assurer que la page n'existe pas. Parce qu'il ya des cas (pas de spam), où certains sites ont une brèche de sécurité et obtenir injectés avec des pages pleines de mauvais mots-clés pour diffamer le site.

Que devriez-vous inquiéter?

Maintenant que nous avons jeté les questions de sécurité et leurs effets sur le classement, la seule chose à vous soucier de vos données est. Le sentier faux que le Spam laisse derrière souille vos rapports.

Il pourrait avoir un impact plus ou moins en fonction de votre trafic sur le site, mais tout le monde est sensible au spam.

Les petites et moyennes sites sont les plus facilement touchés - non seulement parce qu'une grande partie de leur trafic peut être du spam, mais aussi parce que généralement ces sites sont autogérés et parfois ne pas avoir le soutien d'un analyste ou un webmaster.

Big sites avec beaucoup de trafic peuvent également être touchés par le spam, et bien que l'impact peut être insignifiant, le trafic invalide signifie des rapports inexacts, peu importe la taille du site. En tant qu'analyste, vous devriez être en mesure d'expliquer ce qui se passe en même dans les rapports les plus granulaires.

Vous avez seulement besoin d'un filtre pour traiter avec le fantôme du spam

Habituellement, il est recommandé d'ajouter le renvoi à un filtre d'exclusion après qu'il est repéré. Bien que ce soit utile pour une action rapide contre le spam, il dispose de trois grands inconvénients.

  • Faire filtres chaque semaine pour chaque nouveau spam détecté est fastidieux et prend du temps, surtout si vous gérez de nombreux sites. De plus, au moment où vous appliquez le filtre, et il commence à travailler, vous avez déjà quelques données affectées.
  • Certains des spammeurs utilisent des visites directes ainsi que les références.
  • Ces coups directs ne seront pas arrêtés par le filtre de sorte que même si vous excluez le renvoi vous être filon-couche reçoit le trafic invalide, ce qui explique pourquoi certaines personnes ont vu un pic inhabituel dans le trafic direct.

Heureusement, il est un bon moyen d'éviter tous ces problèmes. La plupart des spams (fantôme) fonctionne en appuyant au hasard suivi-ID GA, qui signifie que le délinquant ne sait pas vraiment qui est la cible, et pour cette raison, soit le nom d'hôte est pas défini ou il utilise un faux. (Voir le rapport ci-dessous)

Ghost-Spam.png

Vous pouvez voir qu'ils utilisent des noms étranges ou ne même pas la peine de mettre un. Bien qu'il y ait quelques noms connus dans la liste, ceux-ci peuvent être facilement ajoutés par le spammeur.

D'autre part, le trafic valide sera toujours utiliser un vrai nom d'hôte. Dans la plupart des cas, ce sera le domaine. Mais elle a aussi peut également résulter de services payants, des services de traduction, ou tout autre endroit où vous avez inséré GA code de suivi.


Poster un temps: Aug-10-2015