Все мы знаем, что такое спам: он приходит к нам в почтовые ящики, на мобильные телефоны, в ICQ, в контакте, в одноклассниках, в дневниках и журналах, он повсюду, где собирается определенная аудитория и предназначен для рекламирования своего продукта либо для антирекламы чужого, а также, возможно, для фишинга. Спам бывает различных видов, начиная от писем счастья и оканчивая спамом по логам.

Спаммеры web-сайтов преследуют одну цель – получить как можно больше обратных ссылок на свой сайт для увеличения рейтингов в поисковых системах (тИЦ и/или PageRank), не смотря на то, что поисковики постоянно изменяют свои алгоритмы для улучшения качества поиска и неучета ссылок со спамных ресурсов.
Виды спама сайтов

Рекламный спам
Рассылка среди необходимой аудитории в рекламных целях какого-нибудь продукта или сервиса. Обычно такой вид спама имеет место на форумах, гостевых книгах, социальных сервисах, где собрана аудитория требуемой тематики.

Спам в комментариях
Сообщения в комментариях с ссылкой на свой ресурс. Обычно имеют место в плохомодерируемых блогах или дневниках, где комментарий и ссылку может добавить любой желающий. При этом, на данный момент, спамеры достаточно хорошо маскируются и их посты содержат примерно такой текст: “отличная статья, спасибо!”, “супер, именно то, что я искал!”, “автор жжет” и др.

Автопрогон
Прогон необходимого текста среди досок объявлений, комментариев блогов, форумов со вставкой ссылки на свой сайт. При этом ссылку стараются ставить в невидимом или плохо видимом символе, например – точке.

Рефспам (Реферер спам, Спам в реферере, Спам в логах)
Автоматическое обращение к сайту с подстановкой необходимого реферера. Ссылка на реферер, впоследствии, появляется в логах статистики сайта.

Смайлспам
Тот же автопрогон, только ссылка ставится в смайлике для маскировки.

Ниже в статье хотелось бы подробнее остановиться на одном из видов спама web-сайта – спаме по логам, или рефспаме.

Рефспам или спам по логам
http://devaka.ru/images/59.gif

Понятие рефспама появилось достаточно давно, когда дорвеисты искали любые методы добавления обратных ссылок на свой сайт и улучшения его позиций в серпе. Так, некоторые программы статистики, типа WebAlizer или WebStat в своих отчетах показывают множество данных, собранных из запросов обращения к web-ресурсу. Среди приводимых данных присутствуют источники траффика: рефереры, отсортированные в порядке убывания по количеству запросов с определенного реферера.

Статистика рефереров в WebAlizer

Искать сайты, где установлен WebAlizer или WebStat достаточно не сложно. Для этого в поисковой форме достаточно ввести примерно такой запрос: “Usage Statistics for” site:ru referer. Более 50 тыс. сайтов подвержены рефспаму и злоумышленники этим с удовольствием пользуются.

При рефспаме, обращение к сайту идет автоматически, вытягивая лишь пару килобайт с вашего ресурса, либо не вытягивая его вообще, а подключаясь с помощью функции открытия соединения (fsockopen).

Методы борьбы с рефспамом

Несмотря на заявления поисковых систем Яндекс и Google о том, что они уже не учитывают ссылки с подобных ресурсов, спам по логам не прекращает надоедать владельцам сайтов. Для борьбы с ним необходимо:

1. Во-первых, предотвратить появление ссылок на внешние ресурсы в программах статистики вашего сайта

2. Либо же закрыть статистику от индексации с помощью robots.txt

    User-Agent: *
    Disallow: /webstat/

3. Закрыть доступ в .htaccess для определенных IP адресов или рефереров

    Order allow,deny
    Allow from all
    Deny from 192.168.1.1/8
    Deny from 192.172.0.1/16

Или же запретить доступ с IP другим методом:

    RewriteEngine On
    %{REMOTE_ADDR} ^192\.168\.0\.1$
    RewriteRule ^.*$ – [F]

И закрытие доступа по рефереру:

    RewriteEngine on
    RewriteCond %{HTTP_REFERER} iaea\.org [NC]
    RewriteRule ^.*$ – [F]

Желаем всем вебмастерам решить свою проблему с рефспамом!