Pare de Santo Spam no Google Analytics com um Filtro

O spam no o Google Analytics (GA) está se tornando um problema sério. Devido a um dilúvio de spams referência de botões de redes sociais, sites adultos, e muitas, muitas outras fontes, as pessoas estão começando a tornar-se oprimido por todos os filtros que estão montando para gerenciar os dados inúteis que estão recebendo.

A boa notícia é, não há necessidade de pânico. Neste post, vou focar os erros mais comuns que as pessoas fazem quando se luta contra o spam no GA, e explicar uma maneira eficiente de evitá-lo.

Mas primeiro, vamos ter certeza de que entender como funciona o Spam. Um par de meses atrás, Jared Gardner escreveu um excelente artigo explicando o que o spam de referência é, incluindo a sua finalidade. Ele também apontou alguns grandes exemplos de spams referência.

Tipos de spam

O spam no Google Analytics podem ser categorizadas em dois tipos: fantasmas e esteiras rolantes.

Ghosts

A grande maioria dos spams é deste tipo. Eles são chamados de fantasmas porque nunca acessar o seu site. É importante manter isso em mente, pois é a chave para criar uma solução mais eficiente para o gerenciamento de spam.

Tão incomum quanto parece, este tipo de spam não tem qualquer interação com o seu site em tudo. Você pode se perguntar como isso é possível já que um dos principais objectivos do GA é rastrear visitas aos nossos sites.

Eles fazem isso utilizando o protocolo de avaliação, que permite às pessoas enviar dados diretamente para os servidores do Google Analytics. Usando este método, e códigos de acompanhamento provavelmente gerados aleatoriamente (UA-XXXXX-1), bem como, os spammers deixar uma "visita" com dados falsos, mesmo sem saber quem eles estão batendo.

crawlers

Este tipo de spam, o oposto ao spam fantasma, faz acessar seu site. Como o nome indica, estes spam bots rastrear suas páginas, ignorando as regras como os encontrados em robots.txt que são supostamente para impedi-los de ler o seu site. Quando eles saem do seu site, eles deixam um registro em seus relatórios que aparece semelhante a uma visita legítimo.

Crawlers são mais difíceis de identificar porque eles sabem os seus alvos e utilizar dados reais. Mas também é verdade que os novos raramente aparecem. Então, se você detectar uma referência em suas análises que parece suspeito, pesquisando no Google ou verificando-lo contra esta lista pode ajudá-lo a responder à questão de saber se é ou não spam.

A maioria dos erros comuns feitas quando se lida com spam no GA

Eu tenho acompanhado de perto esta questão nos últimos meses. De acordo com os comentários que as pessoas fizeram em meus artigos e conversas que tenho encontrados em fóruns de discussão, existem basicamente três erros que as pessoas fazem quando se trata de spam no Google Analytics.

Erro # 1. Bloqueio de spam fantasma do arquivo .htaccess

Um dos maiores erros que as pessoas fazem é tentar bloquear Santo Spam do arquivo .htaccess.

Para aqueles que não estão familiarizados com este arquivo, uma das suas principais funções é permitir o acesso / bloco para o seu site. Agora sabemos que os fantasmas nunca chegam a seu site, para adicioná-los aqui não vai ter qualquer efeito e só vai adicionar linhas inúteis ao seu arquivo .htaccess.

Fantasma de spam geralmente aparece por alguns dias e depois desaparece. Como resultado, às vezes as pessoas pensam que eles bloquearam com sucesso a partir daqui, quando na verdade é apenas uma coincidência de calendário.

Então, quando os spammers retornar mais tarde, eles ficam preocupados porque a solução não está mais funcionando, e eles acham que o spammer de alguma forma contornado as barreiras que configurou.

A verdade é, o arquivo .htaccess só pode efetivamente bloquear rastreadores como buttons-for-website.com e alguns outros uma vez que estes acessar seu site. A maioria dos spams não pode ser bloqueado usando esse método, portanto, não há outra opção do que usar filtros para excluí-los.

Erro # 2. Usando a lista de exclusão de referência para parar o Spam

Outro erro é tentar usar a lista de exclusão de referência para parar o spam. O nome pode confundir você, mas esta lista não pretende excluir referências no caminho que queremos para o spam. Tem outras finalidades.

Por exemplo, quando um cliente compra algo, às vezes eles são redirecionados para uma página de terceiros para pagamento. Depois de fazer um pagamento, eles são redirecionados de volta para você site, e GA registra que, como uma nova referência. É conveniente de usar lista de exclusão encaminhamento para impedir que isto aconteça.

Se você tentar usar a lista de exclusão de referência para gerenciar spam, no entanto, a parte de referência será despojado, pois não há registro preexistente. Como resultado, uma visita direta será gravada, e você terá um problema maior do que aquele que começou com uma vez. Você ainda terá spam, e visitas diretas são mais difíceis de controlar.

Erro # 3. Preocupar-se que as mudanças de taxa de rejeição vai afetar rankings

Quando as pessoas vêem que as mudanças taxa de rejeição drasticamente por causa do spam, eles começam a se preocupar com o impacto que isso terá sobre os seus rankings no SERPs.

Este é outro erro comumente feito. Com ou sem spam, o Google não leva em consideração as métricas do Google Analytics como um factor ranking. Aqui está uma explicação sobre isso de Matt Cutts, o ex-chefe da equipe de web spam do Google.

E se você pensar sobre isso, a explicação Cutts 'faz sentido; porque, embora muitas pessoas têm GA, nem todo mundo usa-lo.

Assumindo que o seu site foi invadido

Outra preocupação comum quando as pessoas vêem as páginas de destino estranho vindo de Spam em seus relatórios é que eles foram invadidas.

A página que o Spam mostra sobre os relatórios não existe, e se você tentar abri-lo, você terá uma página 404. Seu site não foi comprometida.

Mas você tem que verificar se a página não existe. Porque há casos (não spam), onde alguns sites têm uma falha de segurança e se injetados com páginas cheias de más palavras-chave para difamar o site.

O que você deve se preocupar?

Agora que já descartado problemas de segurança e seus efeitos sobre rankings, a única coisa que deixou de se preocupar com os seus dados. A trilha falsa que deixa o Spam polui atrás de seus relatórios.

Ele pode ter maior ou menor impacto dependendo do seu tráfego do site, mas todo mundo é suscetível ao spam.

sites de pequeno e médio porte são as mais facilmente afetados - não só porque uma grande parte do seu tráfego pode ser spam, mas também porque geralmente esses sites são auto-administrados e, por vezes, não têm o apoio de um analista ou um webmaster.

Os grandes sites com muito tráfego também podem ser afetados por spam, e, embora o impacto pode ser insignificante, o tráfego inválido significa relatórios imprecisos Não importa o tamanho do site. Como analista, você deve ser capaz de explicar o que está acontecendo no mesmo nos relatórios mais detalhados.

Você só precisa de um filtro para lidar com o spam fantasma

Normalmente, recomenda-se adicionar o encaminhamento para um filtro de exclusão depois de ser descoberto. Embora este seja útil para uma ação rápida contra o spam, ele tem três grandes desvantagens.

  • Fazendo filtros a cada semana para cada novo spam detectado é tedioso e demorado, especialmente se você gerenciar muitos sites. Além disso, pelo tempo que você aplicar o filtro, e ele começa a trabalhar, você já tem alguns dados afetados.
  • Alguns dos spammers usam visitas diretas, juntamente com as referências.
  • Estes ataques diretos não será interrompido pelo filtro por isso mesmo que você está excluindo a referência que você vai peitoril estar recebendo tráfego inválido, o que explica por que algumas pessoas têm visto um aumento excepcional no tráfego direto.

Felizmente, há uma boa maneira de evitar todos estes problemas. A maioria dos spams (fantasma) funciona por bater aleatórios de rastreamento de IDs da GA, o que significa que o agressor não sabe realmente quem é o alvo, e por essa razão, quer o nome do host não está definido ou usa um falso. (Veja relatório abaixo)

Ghost-Spam.png

Você pode ver que eles usam alguns nomes estranhos ou não se incomodam mesmo para definir um. Embora existam alguns nomes conhecidos na lista, estes podem ser facilmente adicionados por o spammer.

Por outro lado, o tráfego válido sempre usará um nome de host real. Na maioria dos casos, este será o domínio. Mas também pode também resultar de serviços pagos, serviços de tradução, ou qualquer outro lugar onde você inseriu o código de acompanhamento GA.


tempo Post: Ago-10-2015