И снова о СПАМе

Всем, наверное, приходится сталкиваться, когда в твоей электронной почте больше половины писем является спамом. Причем, летом его гораздо меньше, что наталкивает на мысль о том, что спамеры тоже люди, и им тоже нужен отдых.

Как же происходит борьба со спамом?

Борьба начинается на почтовом сервере, который пересылает письма, поскольку это экономит трафик и гораздо эффективнее настройки для каждого клиента спам-фильтра.

Используют для этого чаще всего DNS Black Lists, который просто-напросто блокирует всю почту, приходящую с IP, занесенных в черных список. Но в случае отмены спамером IP этот метод не сработает.

Второй вариант борьбы – это текстовый фильтр, когда письма проверяются на нежелательные слова, фрагменты или картинки, характерные для спама. При этом варианте ваше письмо может запросто не дойти до адресата, поскольку  фильтр может «подумать», что фрагменты текста письма входят в список спамовых.

Третий – с умным названием грейлистинг – делает и вправду «умную» вещь: посылает временный отказ, т.е. код ошибки, который почтовая программа вполне понимает, и делает повторную отправку этого письма. Программы же, занимающиеся рассылкой спама, пока этого делать не научилась.

Но это все мы рассказали о «текстовом» спаме. А ведь существует еще и графический спам, и он является десятой частью всего рассылаемого спама!

В случае, если на изображениях есть текст, используется OCR – система оптического распознавания символов, которая очень трудоемкая и «забирает» очень много ресурсов сервера. Кроме того, особенной точности определения спама здесь не получается.

В ответ на использование OCR спамеры изобрели новый вид своей продукции – шумовые письма, когда шум  на изображениях является разноразмерными символами, а текст разбавляется различными линиями или таблицами. В этом случае OCR совершенно бессильна.

Понятно, что достижения в антиспам-технологиях тоже развиваются. И для шумового спама теперь используют вероятно-статистический анализ изображения на последовательность пикселей.

Для детектирования используют определенную длину слов или число символов. Что говорит в пользу этого способа борьбы со спамом, так это еще и скорость обработки, которая выше, чем при методе OCR.

Поэтому сейчас спамеры активно пытаются «навязать» пользователям свою «продукцию» через системы мгновенного обмена сообщениями или социальные сети, а специалисты уже изобретают эффективную форму борьбы со спамом, проходящим не через электронную почту.

Оставить комментарий