Большое количество спама проникает через фильтр на почтовом сервере, который я запускаю, используя относительно простой трюк, начинающийся с нескольких строк (невероятно очевидных) потери веса или другого мошеннического текста вверху, за которым следует большая часть текста из программной документации. - или, что самое страшное, текст соскоблен с Stack Exchange . В лучшем случае Spamassassin расценивает это как BAYES_50, и бывает, что остальные сообщения составлены достаточно тщательно, чтобы они не затрагивали другие триггеры. (Например, заголовки минимальны и правильны.) Часто включенные выдержки достаточно близко совпадают с моими законными интересами, чтобы сообщение в целом оценивалось как BAYES_00, потому что очень спамовые токены просто перегружены сочными самородками решения проблем системного администратора.
Верхняя часть настолько очевидно, что является спамом (и на самом деле имеет тенденцию быть очень похожей на ранее полученные и обученные как спам-сообщения), что я отчасти поражаюсь, что она проходит - но ясно, что это так. Это похоже на отдельный проход, который оценил верхние 25 (или около того) строк сообщения и весил, что в значительной степени решило бы проблему. Есть ли способ сделать это?
Несколько человек предложили написать пользовательские регулярные выражения. Я не хочу вступать в это, так как это постоянная проигрышная битва. Это то, что люди делали до того, как Байесовская сортировка спама получила широкое распространение, и это было вообще ужасно. Ни один человек не может идти в ногу . Это не намного эффективнее, чем просто нажать клавишу удаления для каждого спам-сообщения, и намного больше работы с моей стороны.
Байесовская фильтрация спама. Это даже работает с этим спамом, если я выделю часть « выше сгиба » и просто проанализирую эту часть, удалив приманку / мякину. Вопрос в том, как я могу заставить Спамассасина сделать это?