Как работают спам-боты?


43

У меня есть форум, который сильно пострадали от спам-ботов на форуме, и, конечно, лучший способ победить кого-то - это знать своего врага. Я буду беспокоиться о том, чтобы победить этих спам-ботов позже, но сейчас я бы хотел узнать о них больше. Читая вокруг, я был удивлен отсутствием исчерпывающей информации по этому вопросу (или, возможно, моей неспособности ввести правильные условия поиска для лучших результатов Google).

Мне интересно узнать все о спам-ботов. Я спрашивал на других форумах и получал бесцеремонные ответы типа «Спам-боты - это всегда пользователи, которые регистрируются на вашем сайте».

  • Как работают спам-боты на форуме?
  • Как они находят страницу «регистрация нового пользователя»? (Я особенно удивлен, потому что некоторые форумы не имеют выделенного URL для этого, например, www.forum.com/register.html, но вместо этого используют строки запроса или даже другие методы, невидимые для панели URL)
  • Как они знают, что вводить в каждое поле «регистрация нового пользователя»?
  • Как они определяют, на какую страницу они могут спамить / вводить данные, а что нет?
  • Они вообще вообще "просматривают" эту страницу?
  • Если нет, то я бы предположил, что они общаются с сервером напрямую - как это возможно? Как они это делают?
  • Могут ли спам-боты на форуме сломать капчи? Могут ли они решить логические вопросы (как?)? Математические вопросы?
  • Проводят ли они обратное проектирование сценариев проверки анти-ботов на стороне клиента? Серверные скрипты?
  • Какие методы все еще действуют, чтобы предотвратить их?
  • Откуда берутся спам-боты? Кто-то сидит за компьютером, хихикает, наблюдая, как их бот уничтожает сайт за сайтом? Или они хихикают, когда просто «выпускают» его в интернет? Спам-боты "запускаются" зараженным компьютером где-нибудь? Они копируют себя?
  • так далее

Ответы:


48

Как они находят страницу «регистрация нового пользователя»? (Я особенно удивлен, потому что некоторые форумы не имеют выделенного URL для этого, например, www.forum.com/register.html, но вместо этого используют строки запроса или даже другие методы, невидимые для панели URL)

Они находят новые сайты по:

  • Сканирование и поиск подписей известных программ. Обычно это фрагмент текста, например, авторское право или метатег, но это может быть любой непротиворечивый идентификатор. Это обычно относится к блогам и форумам.
  • Ручное включение. Люди, чей труд дешев во многих частях мира, ищут известное программное обеспечение или формы, которые легко использовать, и добавляют их в базу данных. Это обычно относится к пользовательской регистрации и контактным формам.
  • Они покупают списки. Как спамеры продают адреса электронной почты, так и списки известных уязвимых или предпочитаемых сайтов.

Как они знают, что вводить в каждое поле «регистрация нового пользователя»?

Они знают, что вводить в каждое поле, используя имена полей в качестве руководства. 99,99% времени поле адреса электронной почты называется «электронная почта» или что-то, содержащее слово «электронная почта». Вам не нужно быть ученым, чтобы знать, что это поле, вероятно, для адреса электронной почты. Для таких вещей, как имена, логин, адреса и т. Д. Он работает по тому же принципу.

Как они определяют, на какую страницу они могут спамить / вводить данные, а что нет?

Им все равно. Автоматизированные инструменты могут пробовать очень много форм за такой короткий промежуток времени практически без затрат, поэтому пробовать каждую возможную форму не составит труда. Когда задействован человеческий труд, они могут быть «детишками-сценаристами» и пробовать очевидные вещи, чтобы увидеть, получают ли они какой-либо ответ, который указывает на то, что форма потенциально уязвима. По сути, любая форма является потенциальной целью для них, как и любая страница, которая принимает пользовательский ввод.

Как работают спам-боты на форуме?

Они вообще вообще "просматривают" эту страницу? Если нет, то я бы предположил, что они общаются с сервером напрямую - как это возможно? Как они это делают?

Откуда берутся спам-боты? Кто-то сидит за компьютером, хихикает, наблюдая, как их бот уничтожает сайт за сайтом? Или они хихикают, когда просто «выпускают» его в интернет? Спам-боты "запускаются" зараженным компьютером где-нибудь? Они копируют себя?

Это все автоматизировано. Такие инструменты, как xrumer, создаются и продаются и содержат возможность использовать программное обеспечение с известными уязвимостями. Любой может купить его, и после того, как он настроен, он более или менее загорелся и забыл. Он идет на каждый форум в своем списке и пытается спамить его в меру своих возможностей. Просто благодаря грубой силе он успешен и стоит спамерам. Вот почему они никогда не останавливаются. Им только нужно поднять палец, чтобы это сработало.

Могут ли спам-боты на форуме сломать капчи? Могут ли они решить логические вопросы (как?)? Математические вопросы?

Да, но не всегда. Зависит от того, насколько хорошо это реализовано. Но многие капчи, в том числе предлагаемые крупными компаниями, были избиты и фактически бесполезны. Вот почему для их остановки требуются различные формы защиты. Даже тогда люди могут побить любую систему.

Какие методы все еще действуют, чтобы предотвратить их?

Из предыдущего ответа : вы могли бы сделать несколько вещей (и должны делать больше одного), включая:

1) Поставить поддельное поле, которое увидят только боты. Затем, если это поле отправлено с остальной частью формы, вы можете проигнорировать его (и заблокировать их при желании). Вы также можете ловить плохих ботов, которые переходят по скрытой ссылке .

2) Используйте CAPATCHA как reCAPTCHA

3) Используйте поле, которое требует от пользователя ответа на вопрос, например, что 5 + 3. Любой человек может ответить на него, но бот не будет знать, что делать, так как он автоматически заполняет поля на основе имен полей. Так что это поле будет либо неправильным, либо пропущенным, и в этом случае отправка будет отклонена.

4) Используйте токен и поместите его в сеанс, а также добавьте его в форму. Если токен не отправлен с формой или не совпадает, то он автоматизирован и может быть проигнорирован.

5) Ищите повторные представления с одного и того же IP-адреса. Если ваша форма не должна получать слишком много запросов, но вдруг она, вероятно, попадает под бот, и вам следует рассмотреть временную блокировку IP-адреса.

6) Используйте Akismet . Отлично подходит для выявления спама.


5
+1 за подробный ответ. У меня была проблема со спамом, я реализовал скрытый элемент формы и назвал его «электронная почта» / «почта», а реальный адрес электронной почты я назвал «адрес». Нет больше спама!
марта

1
Хороший пост о том, как бороться с троллями (идея спам-ботов одинакова): codinghorror.com/blog/2011/06/suspension-ban-or-hellban.html .
ercpe

Для капч это зависит от того, какой инструмент они используют, чтобы победить их. Существуют программы, которые иногда (и не всегда) пропускают капчи, а затем есть сервисы, использующие дешевую рабочую силу для решения капч, и они имеют более высокий уровень успеха.
ub3rst4r

11

Как работают спам-боты на форуме?

Их пишут талантливые (если не злые) программисты - возможно, спам-ботов так же много, как и людей, которые их пишут, но, к сожалению, всего несколько авторов-спамботов делятся и продают свои работы, чтобы разрушить жизнь администраторов ...

Одно популярное приложение для рассылки спама на форумах называется "xrumer".

Хотя я понимаю, что это не отвечает на все ваши вопросы, я думаю, стоит упомянуть, что все, что бот не может сделать хорошо (например, решить сложные нестатические вопросы логики), может сделать низкооплачиваемый работник за границей. Спам - это бизнес, похожий на любой другой, и нет недостатка в дешевой рабочей силе, направленной на распространение спам-сообщений.


4
Я чувствую, что только что наблюдал, как корова перерабатывается на мясном заводе. Но очень информативно.
rlb.usa

Интересное видео, смешно, что оно было сделано в канун Рождества; дата была 12-25-2006 12:15 ... :-)
промахи

Ack! видимо, не такой талантливый ... Эта программа напоминает мне FriendBlaster (мы привыкли использовать его на работе - я был против, но босс не слушал). Я не сомневаюсь, сколько времени и усилий автор вложил в программу. Но, честно говоря, ничего, что выполняется, не так сложно реализовать (и плохо реализовано в случае FriendBlaster). Гораздо более впечатляющими являются хакеры и исследователи безопасности, которые разрабатывают эксплойты и разрушают схемы DRM в течение нескольких недель после их выпуска.
Lèse Majesté

2

Я сделал антиспам плагин для WordPress , он довольно хорошо блокирует спам без капчи или чего-либо еще.

Как это работает: два дополнительных поля добавляются в форму комментариев. Первый вопрос о текущем году. Второй должен быть пустым. Если пользователь посещает сайт, то первое поле автоматически отвечает с помощью javascript, второе поле остается пустым, и оба поля скрыты и невидимы для пользователя. Если спамер попытается отправить форму комментария, он ошибется с ответом в первом поле или попытается отправить пустое поле, и спам-комментарий будет отклонен. Пользователь не должен вводить Captcha или что-либо еще, чтобы доказать, что это не бот, все сделано с помощью JavaScript.

Вы можете скачать плагин и использовать код для решения проблемы со спамом на вашем сайте.


1
Таким образом, ваши пользователи нуждаются в JavaScript, чтобы иметь возможность зарегистрироваться? Это потеря доступности, верно?
Августин Ридингер

@AugustinRiedinger Антиспам плагин с отключенным JavaScript работает как простой подход captha. Около 2% пользователей отключили JavaScript.
webvitaly

Ты имеешь в виду, что в этом случае вы бы выводили капчу, верно? Я знаю, что там очень мало пользователей, но я думал с точки зрения наилучшей практики. Читайте интересные вещи об этом, хотя.
Августин Ридингер

@AugustinRiedinger Да, я показываю похожий на капчу вопрос о текущем году, если пользователь отключил JavaScript.
webvitaly

0

Когда я пытаюсь победить их, я хотел бы иметь в виду, что их целью обычно является размещение ссылок на как можно большем количестве веб-сайтов для получения выгоды от SEO.

Их волнует количество сайтов, к которым они получают доступ, а не ваш сайт конкретно. Кто-то, кто просто хочет спамить только на вашем сайте, может просто зарегистрироваться без использования робота.

Таким образом, я уверен, что хорошо написанный тест на заказ (например, вопросы, на которые ваши участники форума будут знать ответ) почти всегда будет более эффективным против роботов, чем любой заранее написанный, который роботы, вероятно, будут мудрыми к.

Например, если робот взломает Recaptcha, у него будет доступ к миллионам форм для спама. Если бы он взломал сделанный на заказ тест, то у него был бы доступ только к одному веб-сайту, так что ни один автоматизированный спам-бот не будет этим заниматься.

https://www.projecthoneypot.org может предоставить некоторые хорошие данные для использования (например, ключевые слова и ips для блокировки)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.