Все мы знаем, что такое спам: он приходит к нам в почтовые ящики, на мобильные телефоны, в ICQ, в контакте, в одноклассниках, в дневниках и журналах, он повсюду, где собирается определенная аудитория и предназначен для рекламирования своего продукта либо для антирекламы чужого, а также, возможно, для фишинга. Спам бывает различных видов, начиная от писем счастья и оканчивая спамом по логам.
Спаммеры web-сайтов преследуют одну цель – получить как можно больше обратных ссылок на свой сайт для увеличения рейтингов в поисковых системах (тИЦ и/или PageRank), не смотря на то, что поисковики постоянно изменяют свои алгоритмы для улучшения качества поиска и неучета ссылок со спамных ресурсов.
Виды спама сайтов
Рекламный спам
Рассылка среди необходимой аудитории в рекламных целях какого-нибудь продукта или сервиса. Обычно такой вид спама имеет место на форумах, гостевых книгах, социальных сервисах, где собрана аудитория требуемой тематики.
Спам в комментариях
Сообщения в комментариях с ссылкой на свой ресурс. Обычно имеют место в плохомодерируемых блогах или дневниках, где комментарий и ссылку может добавить любой желающий. При этом, на данный момент, спамеры достаточно хорошо маскируются и их посты содержат примерно такой текст: “отличная статья, спасибо!”, “супер, именно то, что я искал!”, “автор жжет” и др.
Автопрогон
Прогон необходимого текста среди досок объявлений, комментариев блогов, форумов со вставкой ссылки на свой сайт. При этом ссылку стараются ставить в невидимом или плохо видимом символе, например – точке.
Рефспам (Реферер спам, Спам в реферере, Спам в логах)
Автоматическое обращение к сайту с подстановкой необходимого реферера. Ссылка на реферер, впоследствии, появляется в логах статистики сайта.
Смайлспам
Тот же автопрогон, только ссылка ставится в смайлике для маскировки.
Ниже в статье хотелось бы подробнее остановиться на одном из видов спама web-сайта – спаме по логам, или рефспаме.
Рефспам или спам по логам
Понятие рефспама появилось достаточно давно, когда дорвеисты искали любые методы добавления обратных ссылок на свой сайт и улучшения его позиций в серпе. Так, некоторые программы статистики, типа WebAlizer или WebStat в своих отчетах показывают множество данных, собранных из запросов обращения к web-ресурсу. Среди приводимых данных присутствуют источники траффика: рефереры, отсортированные в порядке убывания по количеству запросов с определенного реферера.
Статистика рефереров в WebAlizer
Искать сайты, где установлен WebAlizer или WebStat достаточно не сложно. Для этого в поисковой форме достаточно ввести примерно такой запрос: “Usage Statistics for” site:ru referer. Более 50 тыс. сайтов подвержены рефспаму и злоумышленники этим с удовольствием пользуются.
При рефспаме, обращение к сайту идет автоматически, вытягивая лишь пару килобайт с вашего ресурса, либо не вытягивая его вообще, а подключаясь с помощью функции открытия соединения (fsockopen).
Методы борьбы с рефспамом
Несмотря на заявления поисковых систем Яндекс и Google о том, что они уже не учитывают ссылки с подобных ресурсов, спам по логам не прекращает надоедать владельцам сайтов. Для борьбы с ним необходимо:
1. Во-первых, предотвратить появление ссылок на внешние ресурсы в программах статистики вашего сайта
2. Либо же закрыть статистику от индексации с помощью robots.txt
User-Agent: *
Disallow: /webstat/
3. Закрыть доступ в .htaccess для определенных IP адресов или рефереров
Order allow,deny
Allow from all
Deny from 192.168.1.1/8
Deny from 192.172.0.1/16
Или же запретить доступ с IP другим методом:
RewriteEngine On
%{REMOTE_ADDR} ^192\.168\.0\.1$
RewriteRule ^.*$ – [F]
И закрытие доступа по рефереру:
RewriteEngine on
RewriteCond %{HTTP_REFERER} iaea\.org [NC]
RewriteRule ^.*$ – [F]
Желаем всем вебмастерам решить свою проблему с рефспамом!