Deja de Santo spam en Google Analytics con un filtro

El correo no deseado en Google Analytics (GA) se está convirtiendo en un problema grave. Debido a una avalancha de correo no deseado remisión de los botones sociales, sitios para adultos, y muchas, muchas otras fuentes, la gente está empezando a ser abrumados por todos los filtros que se configurar para administrar los datos inútiles que están recibiendo.

La buena noticia es que no hay necesidad de pánico. En este post, voy a centrarse en los errores más comunes que se cometen cuando la lucha contra el spam en GA, y explicar de una manera eficiente para evitarlo.

Pero primero, vamos a asegurarnos de que entendemos cómo funciona el correo no deseado. Hace un par de meses, Jared Gardner escribió un excelente artículo que explica lo que es el spam de referencia, incluyendo los fines previstos. También señaló algunos grandes ejemplos de correo no deseado de referencia.

Tipos de spam

El correo no deseado en Google Analytics se puede clasificar en dos tipos: los fantasmas y los rastreadores.

fantasmas

La gran mayoría del spam es este tipo. Se llaman fantasmas porque nunca acceden a su sitio. Es importante tener esto en cuenta, ya que es clave para crear una solución más eficiente para la gestión de correo no deseado.

Tan inusual como suena, este tipo de spam no tiene ninguna interacción con su sitio en absoluto. Usted puede preguntarse cómo es posible ya que uno de los propósitos principales de GA es realizar un seguimiento de las visitas a nuestros sitios.

Lo hacen mediante el uso del protocolo de medición, que permite a las personas enviar datos directamente a los servidores de Google Analytics. Usando este método, y los códigos de seguimiento probablemente generados al azar (UA-XXXXX-1), así, los spammers dejar una "visita" con datos falsos, sin siquiera saber quiénes están golpeando.

rastreadores

Este tipo de correo no deseado, lo opuesto es de spam fantasma, hace acceder a su sitio. Como su nombre lo indica, estos robots de spam rastreen sus páginas, haciendo caso omiso de las reglas como las que se encuentran en el archivo robots.txt que se supone que para que dejen de leer su sitio. Cuando salen de su sitio, que dejan un registro en sus informes que se parece a una visita legítimo.

Rastreadores son más difíciles de identificar porque saben que sus objetivos y utilizar datos reales. Pero también es cierto que los nuevos raramente aparecen. Así que si detecta una referencia en los análisis que parece sospechoso, investigando en Google o control contra esta lista podría ayudar a contestar la pregunta de si es o no spam.

La mayoría de los errores comunes que se cometen cuando se trata de correo no deseado en GA

He estado siguiendo de cerca este asunto en los últimos meses. De acuerdo con los comentarios de personas han hecho sobre mis artículos y conversaciones que he encontrado en foros de discusión, existen principalmente tres errores que se cometen al tratar con el spam en Google Analytics.

Error # 1. El bloqueo de correo no deseado fantasma del archivo .htaccess

Uno de los mayores errores que se cometen es tratar de bloquear el fantasma del spam desde el archivo .htaccess.

Para aquellos que no están familiarizados con este archivo, una de sus principales funciones es la de permitir / bloquear el acceso a su sitio. Ahora sabemos que los fantasmas nunca llegan a su sitio, por lo que añadir aquí no tendrá ningún efecto y sólo añadirán líneas inútiles a su archivo .htaccess.

Santo correo no deseado por lo general aparece durante unos días y luego desaparece. Como resultado, a veces la gente piensa que bloquearon con éxito a partir de aquí cuando en realidad es sólo una coincidencia en el tiempo.

Luego, cuando los spammers regresan más tarde, se preocupan porque la solución ya no funciona, y creen que el spammer alguna manera pasa por alto las barreras que constituyan.

La verdad es que el archivo .htaccess sólo puede bloquear con eficacia los rastreadores como buttons-for-website.com y algunos otros ya que estos acceden a su sitio. La mayor parte del correo no deseado no puede ser bloqueada mediante este método, por lo que no hay otra opción que usar filtros para excluirlos.

Error # 2. Uso de la lista de exclusión de referencia para detener el spam

Otro error está tratando de utilizar la lista de exclusión de referencia para detener el correo no deseado. El nombre que puede confundir, pero esta lista no pretende excluir las referencias en la forma en que queremos para el correo no deseado. Tiene otros fines.

Por ejemplo, cuando un cliente compra algo, a veces se redirecciona a una página de terceros para el pago. Después de hacer un pago, que están redirigidos de vuelta a su página web, y registra GA que a medida que una nueva referencia. Es adecuado utilizar la lista de exclusión de referencia para evitar que esto suceda.

Si intenta utilizar la lista de exclusión de derivación para correo no deseado, sin embargo, la parte de referencia será despojado ya que no hay ningún registro preexistente. Como resultado, se grabará una visita directa, y usted tendrá un problema más grande que la que empezó con el puesto. Usted todavía tiene correo no deseado, y visitas directas son más difíciles de rastrear.

Error # 3. Preocuparse de que cambios en la tasa de rebote afectará las clasificaciones

Cuando la gente ve que los cambios en la tasa de rebote drásticamente debido al correo no deseado, empiezan a preocuparse por el impacto que tendrá en sus posiciones en los SERPs.

Este es otro error común hecho. Con o sin correo no deseado, Google no tiene en cuenta las métricas de Google Analytics como un factor de clasificación. He aquí una explicación sobre esto de Matt Cutts, el ex jefe de equipo de spam web de Google.

Y si se piensa en ello, la explicación Cutts 'tiene sentido; porque a pesar de que muchas personas tienen GA, no todo el mundo lo usa.

Asumiendo que su sitio ha sido hackeado

Otra preocupación común cuando la gente ve las páginas de destino extraños procedentes de spam en sus informes es que han sido hackeados.

La página que el correo no deseado muestra en los informes no existe, y si intenta abrirlo, obtendrá una página 404. Su sitio no ha sido comprometida.

Pero usted tiene que asegurarse de que la página no existe. Debido a que hay casos (no spam), donde algunos sitios tienen una brecha de seguridad y se les inyectan con páginas llenas de palabras clave incorrectas para difamar a la página web.

¿Qué debe preocuparse?

Ahora que hemos descartado problemas de seguridad y sus efectos en el ranking, lo único que queda es que preocuparse por sus datos. El sendero falso que sale del correo basura contamina detrás de sus informes.

Podría haber mayor o menor impacto en función de su tráfico del sitio, pero todo el mundo es susceptible al spam.

Los sitios pequeños y medianos son los más fácilmente impactado - no sólo porque una gran parte de su tráfico puede ser correo no deseado, sino también por lo general, estos sitios son autogestionada y, a veces no tienen el apoyo de un analista o un webmaster.

sitios grandes con una gran cantidad de tráfico también pueden verse afectados por el spam, y aunque el impacto puede ser insignificante, el tráfico no válido significa informes inexactos sin importar el tamaño de la página web. Como analista, que debe ser capaz de explicar lo que está pasando en incluso en los informes más granulares.

Sólo necesita un filtro para lidiar con el spam fantasma

Por lo general se recomienda añadir la referencia a un filtro de exclusión después de que se descubrió. Aunque esto es útil para una acción rápida contra el correo no deseado, que tiene tres grandes desventajas.

  • Haciendo filtros cada semana por cada nuevo spam detectado es tedioso y consume mucho tiempo, especialmente si usted maneja muchos sitios. Además, en el momento de aplicar el filtro, y se pone en marcha y que ya tenga algunos datos afectados.
  • Algunos de los spammers utilizan visitas directas, junto con las referencias.
  • Estos accesos directos no serán detenidos por el filtro por lo que incluso si usted está excluyendo la referencia va alféizar estar recibiendo el tráfico no válido, lo que explica por qué algunas personas han visto un aumento inusual en el tráfico directo.

Por suerte, hay una buena manera de evitar todos estos problemas. La mayor parte del correo no deseado (fantasma) Obras de golpear al azar de seguimiento-IDs de GA, es decir, el delincuente no sabe realmente que es el objetivo, y por eso el nombre del equipo no se activa o se utiliza uno falso. (Véase el informe más adelante)

Santo-Spam.png

Se puede ver que utilizan algunos nombres extraños o ni siquiera se molestan en establecer uno. Aunque hay algunos nombres conocidos en la lista, estos pueden ser fácilmente añadidos por el spammer.

Por otro lado, el tráfico válido siempre utilizará un nombre de host real. En la mayoría de los casos, este será el dominio. Pero también puede deberse también a los servicios de pago, servicios de traducción, o cualquier otro lugar donde se ha insertado el código de seguimiento GA.


Fecha publicación: Ago-10-2015