Стоп-призрак Спам в Google Analytics с одним фильтром

Спам в Google Analytics (GA) становится серьезной проблемой. В связи с наводнением направления спама из социальных кнопок, сайты для взрослых, и много, много других источников, люди начинают становиться перегружены все фильтры они настраиваете для управления бесполезных данных , которые они получают.

Хорошая новость заключается в том, что нет оснований для паники. В этом посте я собираюсь сосредоточиться на наиболее распространенных ошибок, которые люди делают, когда борьбу со спамом в СА, и объяснить, эффективный способ, чтобы предотвратить это.

Но во-первых, давайте удостоверимся, что мы понимаем, как спам работает. Пару месяцев назад, Джаред Гарднер написал отличную статью, объясняющую, что направление спама, в том числе и по прямому назначению. Он также отметил некоторые большие примеры направления спама.

Виды спама

Спам в Google Analytics можно разделить на два типа: привидения и сканерам.

привидения

Подавляющее большинство спама этого типа. Их называют призраками, потому что они никогда не получить доступ к сайту. Важно помнить об этом, так как это ключ к созданию более эффективного решения для управления спамом.

Как необычно это звучит, этот тип спама не имеет какого-либо взаимодействия с вашего сайта на всех. Вы можете задаться вопросом, как это возможно, так как одна из главных целей ГА является отслеживание посещений наших сайтов.

Они делают это с помощью протокола измерения, что позволяет людям передавать данные непосредственно на серверы Google Analytics. Используя этот метод, и, вероятно, случайно генерируемые коды отслеживания (UA-XXXXX-1), а также, спамеры оставить "посетить" с фальшивыми данными, даже не зная, кто они бьют.

ползунки

Этот тип спама, наоборот, чтобы призрак спама, делает доступ к сайту. Как следует из названия, эти спам-ботов сканировать ваши страницы, игнорируя правила, как те, что в файле robots.txt, которые должны остановить их от чтения вашего сайта. Когда они покидают ваш сайт, они оставляют записи на отчетах, что кажется подобным легитимной визитом.

Искатели труднее определить, потому что они знают свои цели и использовать реальные данные. Но это также верно, что новые редко появляются. Так что если вы обнаружили направление в ваших аналитику, которая выглядит подозрительным, исследуя его на Google или проверки его против этого списка может помочь вам ответить на вопрос о том, является ли оно спамом.

Большинство распространенных ошибок при работе со спамом в GA

Я следовал за этот вопрос тесно в течение последних нескольких месяцев. Согласно комментариям людей, которые сделали на моих статей и бесед, которые я нашел в дискуссионных форумах, есть прежде всего три ошибки делают люди, когда дело со спамом в Google Analytics.

Ошибка № 1. Блокирование спама призрак из файла .htaccess

Одна из самых больших ошибок, которые делают люди пытаются блокировать спам-призрак из файла .htaccess.

Для тех, кто не знаком с этим файлом, одним из его основных функций является разрешить / запретить доступ к вашему сайту. Теперь мы знаем, что призраки никогда не достигают вашего сайта, так что добавление их здесь не будет иметь никакого эффекта и добавит только бесполезные строки в файле .htaccess.

Призрак спам обычно проявляется в течение нескольких дней, а затем исчезает. В результате, иногда люди думают, что они успешно блокировали его отсюда, когда на самом деле это просто совпадение времени.

Затем, когда спамеры позже возвращаются, они волноваться, потому что решение не работает больше, и они думают, что спамер каким-то образом обойти барьеры они создали.

Правда, файл .htaccess может только эффективно блокировать сканерам, такие как buttons-for-website.com и несколько других, так как они получить доступ к сайту. Большая часть спама не может быть заблокирован с помощью этого метода, так что нет никакого другого выбора, чем при использовании фильтров, чтобы исключить их.

Ошибка № 2. Использование приглашений список исключений, чтобы остановить спам

Другая ошибка пытается использовать реферальную список исключений, чтобы остановить спам. Название может сбить вас с толку, но этот список не предназначен для исключения направления так, как мы хотим для спама. Он имеет и другие цели.

Например, когда клиент покупает что-то, иногда они получают перенаправлены на страницу стороннего для оплаты. После внесения платежа, они перенаправлены обратно к вам веб-сайт, и GA отмечает, что в качестве нового направления. Целесообразно использовать реферальную список исключений, чтобы не допустить этого.

Если вы попытаетесь использовать реферальную список исключений для управления спамом, однако, направление части будут вырезаны, так как нет существовавшие ранее записи. В результате прямой визит будет записан, и вы будете иметь большую проблему, чем тот, который вы начали с тех пор. Вы по-прежнему есть спам, а также прямые посещения труднее отслеживать.

Ошибка № 3. Беспокоясь, что изменения скорости отскока будут влиять на ранжирование

Когда люди видят, что изменения скорости отскока резко из-за спама, они начинают беспокоиться о том влиянии, которое она окажет на их ранжирование в результатах поиска.

Это еще одна ошибка, как правило, сделаны. С или без спама, Google не учитывает метрик учет Google Analytics как фактор ранжирования. Вот объяснение об этом от Мэтт Каттс, бывший глава веб-спама командой Google.

И если вы думаете об этом, объяснение Cutts 'имеет смысл; потому что, хотя многие люди имеют GA, не каждый использует его.

Предположим, что ваш сайт был взломан

Другой распространенной проблемой, когда люди видят странные целевые страницы приходят от спама на своих отчетах, что они были взломаны.

На странице, что спам показывает на отчетах не существует, и если вы попытаетесь открыть его, вы получите страницу 404. Ваш сайт не был скомпрометирован.

Но вы должны убедиться, что страница не существует. Потому что есть случаи (не спам), где некоторые сайты имеют брешь в безопасности и получить инъецированные страниц полные плохих слов, чтобы опорочить веб-сайт.

Что вы должны беспокоиться?

Теперь, когда мы отбрасывали вопросы безопасности и их влияние на рейтинги, единственное, что осталось, чтобы беспокоиться о ваших данных. Поддельный след, что спам оставляет загрязняет свои отчеты.

Это может иметь большее или меньшее влияние в зависимости от трафика вашего сайта, но каждый восприимчив к спам.

Малые и средние сайты являются наиболее легко воздействие - не только потому, что большая часть их трафика может быть спам, но и потому, как правило, эти сайты являются самоуправляемые, а иногда и не имеют поддержки со стороны аналитика или веб-мастеров.

Большие участки с большим количеством трафика также может повлиять на спам, и хотя воздействие может быть незначительным, недействительный трафик означает неточные сообщения независимо от размера веб-сайта. Как аналитик, вы должны быть в состоянии объяснить, что происходит в даже в самых подробных отчетов.

Вам нужно только один фильтр, чтобы иметь дело с призраком спам

Обычно рекомендуется добавить направление к исключению фильтра после его обнаружения. Несмотря на то, что это полезно для быстрого действия против спама, у него есть три большие недостатки.

  • Создание фильтров каждую неделю для каждого нового спама обнаруженного утомительно и отнимает много времени, особенно если вы управлять многими сайтами. Кроме того, к тому времени, применить фильтр, и он начинает работать, у вас уже есть некоторые данные пострадавших.
  • Некоторые из спамеров используют прямые посещения вместе с рефералов.
  • Эти прямые удары не будут остановлены фильтром, так что даже если вы за исключением реферал вы будете получать подоконник недопустимый трафик, который объясняет, почему некоторые люди видели необычный всплеск прямого трафика.

К счастью, есть хороший способ, чтобы предотвратить все эти проблемы. Большая часть спама (призрак) работает, нажав случайные отслеживания идентификаторов GA, а это означает преступник на самом деле не знает, кто является целевой, и по этой причине либо имя хоста не установлен или он использует поддельный. (См отчет ниже)

Ghost-Spam.png

Вы можете видеть, что они используют некоторые странные имена или даже не удосужились установить один. Хотя есть некоторые известные имена в списке, то они могут быть легко добавлены спамером.

С другой стороны, действительное движение всегда будет использовать реальное имя хоста. В большинстве случаев, это будет домен. Но это также может быть также результатом платных услуг, услуг по переводу, или в любом другом месте, где вы вставили код отслеживания GA.


Время размещения: Авг-10-2015