Спам. Читая Paul Graham
Jan. 29th, 2004 04:36 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Общеизвестно, что спам не мог бы существовать, если бы не обладал хоть какой-то положительной эффективностью. На миллион матерящихся получателей придётся хотя бы один, кто купит услугу или товар.
Не столь очевидна причина того, что составители спама стремятся обойти фильтры. Я не могу представить, зачем гипотетический юзер виагры или любитель порнухи будeт включать автоудаление почты по ключевым словам "Viagra" и "sex" или скармливать мешок подобных писем bogofilter'у -s. Если рассматривать систему "Заказчик - Спамер - получатели", соревнование спаммеров с фильтрами - совершенно неожиданное явление. Конечным состоянием такой системы должна быть полная идиллия, когда спамер аккуратно проставляет заголовок X-Advertisement: yes, а все желающие фильтруют по нему почту. Заказчику и Спамеру хорошо: у них не пропало ни одного потенциального клиента, и в то же время никто не скажет о них дурного слова. Всем получателям тоже хорошо: кто не против читать рекламу, спокойно её читает. Остальные - не читают.
Так откуда же берётся здесь "соревнование брони и снаряда"? Я вижу единственный случай, когда обход фильтров полезен спамеру: если фильтрацию инициирует не сам пользователь, а его работодатель, системный администратор, провайдер, почтовая служба - в общем, большой умный дядя где-то сбоку (Man In The Middle). Вася Пупкин с удовольствием бы увеличил свой пенисъ, но собака-провайдер отправляет такие предложения в /dev/null. Спамер придумывает сто двадцать восьмой извращённый вариант написания слова V1AgRA, чтобы письмо всё-таки дошло до Васи.
Выводы я сделал следующие: во-первых, unsolicited spam filtering нужно давить - не только потому, что от такой "услуги", как правило, сплошные false positives и прочие неудобства, но и потому, что это единственная (?) значимая объективная предпосылка для соревнования спамеров с фильтрами. А ведь, не будь этого соревнования, любой личный пользовательский обучающийся фильтр быстро достигал бы стопроцентной эффективности.
Во-вторых, bogofilter и прочие аналогичные средства никогда не станут мишенью для целенаправленного обхода спамерами. Для их обучения необходимо участие юзера, а если он это делает - он уже не потенциальный клиент для спамера и его заказчика. А если отомрёт централизованный провайдерско-админский content filtering, спамерам станет выгодно писать слова без искажений, чтобы рассылку обязательно прочитал тот странный тип, который так интересуется грузчиками в Москве, что скармливает их рекламу bogofilter -n.
Не столь очевидна причина того, что составители спама стремятся обойти фильтры. Я не могу представить, зачем гипотетический юзер виагры или любитель порнухи будeт включать автоудаление почты по ключевым словам "Viagra" и "sex" или скармливать мешок подобных писем bogofilter'у -s. Если рассматривать систему "Заказчик - Спамер - получатели", соревнование спаммеров с фильтрами - совершенно неожиданное явление. Конечным состоянием такой системы должна быть полная идиллия, когда спамер аккуратно проставляет заголовок X-Advertisement: yes, а все желающие фильтруют по нему почту. Заказчику и Спамеру хорошо: у них не пропало ни одного потенциального клиента, и в то же время никто не скажет о них дурного слова. Всем получателям тоже хорошо: кто не против читать рекламу, спокойно её читает. Остальные - не читают.
Так откуда же берётся здесь "соревнование брони и снаряда"? Я вижу единственный случай, когда обход фильтров полезен спамеру: если фильтрацию инициирует не сам пользователь, а его работодатель, системный администратор, провайдер, почтовая служба - в общем, большой умный дядя где-то сбоку (Man In The Middle). Вася Пупкин с удовольствием бы увеличил свой пенисъ, но собака-провайдер отправляет такие предложения в /dev/null. Спамер придумывает сто двадцать восьмой извращённый вариант написания слова V1AgRA, чтобы письмо всё-таки дошло до Васи.
Выводы я сделал следующие: во-первых, unsolicited spam filtering нужно давить - не только потому, что от такой "услуги", как правило, сплошные false positives и прочие неудобства, но и потому, что это единственная (?) значимая объективная предпосылка для соревнования спамеров с фильтрами. А ведь, не будь этого соревнования, любой личный пользовательский обучающийся фильтр быстро достигал бы стопроцентной эффективности.
Во-вторых, bogofilter и прочие аналогичные средства никогда не станут мишенью для целенаправленного обхода спамерами. Для их обучения необходимо участие юзера, а если он это делает - он уже не потенциальный клиент для спамера и его заказчика. А если отомрёт централизованный провайдерско-админский content filtering, спамерам станет выгодно писать слова без искажений, чтобы рассылку обязательно прочитал тот странный тип, который так интересуется грузчиками в Москве, что скармливает их рекламу bogofilter -n.