Как отфильтровать сообщения с анимированными смайликами в теме в Gmail?


27

Я просматривал папку со спамом (что я редко делаю, потому что в Gmail редко бывают ложные срабатывания), и я заметил кое-что интересное:

примерный список спам-сообщений

Примерно в более чем половине сообщений есть по крайней мере один анимированный смайлик в теме.

Никто из моих друзей не использовал бы это дерьмо. Ни одна действительная компания, с которой я бы имел дело, никогда бы этого не сделала.

Как создать фильтр для автоматического удаления сообщений с анимированными смайликами в теме?

Используя jamesmstone ключ «s ниже, я попробовал поиск с subject:=?UTF-8?и subject:"=?UTF-8?"и несколько других перестановок, но никто не работал.

Вот примерный набор заголовков из одной из этих дымящихся куч:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
Интересно, если они goomoji...
Джеймсстон

@jamesmstone: Я ожидаю, что они есть.
эль

Ответы:


9

Краткий ответ

Вместо использования фильтров Gmail, которые зависят от функции поиска Gmail, для поиска закодированных смайликов в оригинальных сообщениях, создайте сценарий, используя метод GmailMessage :: getRawContent () скрипта Google Apps для обработки сообщений.

Смежные вопросы

Ниже приведены ссылки на ответы на похожие вопросы на этом сайте, включая сценарии с использованием указанного метода.


2
Стоит отметить, что скрипт не может полностью удалить сообщение - самое большее, что он может сделать, это переместить его в папку для мусора или спама. И если такие сообщения уже попадают в спам, от сценария мало пользы.

@Minestrone: На самом деле, можно полностью удалить сообщение, используя скрипт. Следует использовать Gmail API. См. Developers.google.com/gmail/api/v1/reference/users/messages/… . Чтобы использовать API Gmail в Google Apps Script, см. Developer.google.com/apps-script/guides/services/advanced .
Рубен

1
Я не столько заинтересован в том, чтобы на самом деле удалить сообщение, сколько в том, чтобы найти способ отфильтровать их. Я мог бы просто захотеть наклеить на них ярлык.
Эля

@AlE. Я предполагал это, поэтому я не упомянул об использовании API GMAIL в тексте ответа. С другой стороны, к счастью, я не получил письмо с смайликами на эту тему.
Рубен

4

Я создал скрипт Google Apps для таких целей.

Это на Github: https://github.com/spamzero/spamzero

Он позволяет вам создавать всевозможные расширенные правила, которые вы можете сопоставить со своей папкой спам-сообщений, поэтому сообщения, которые определенно являются спамом, будут автоматически очищаться.


1
Ваш ответ будет лучше, если вы включите краткое описание сценария, подчеркивающее, как он поможет обрабатывать сообщения с анимированными смайликами в теме.
Рубен

4
Я согласен с @ Rubén, чем больше информации, тем лучше. Так как это позволяет читателям проверять жизнеспособность ответов, не перепрыгивая через слишком много обручей.
Мишельфрансис Бустильос

Спасибо за этот скрипт! Иногда наиболее полезными являются решения, которые уменьшают ежедневные неприятности, такие как анимированный спам. Я бы предложил добавить в Github README эту ссылку для быстрого запуска скриптов Google Apps, чтобы пользователи, не имеющие опыта использования скриптов, знали, как включить API Gmail и просматривать журналы.
Дан

1

Это не совсем то, что вы просите (отфильтровывать сами смайлики, а не сообщения с смайликами), но вы можете найти часть контента полезной для создания лучшего фильтра сообщений.

Теперь существует сценарий Greasemonkey / Tampermonkey / Violentmonkey с открытым исходным кодом, позволяющий избавиться от этих раздражающих визуальных тараканов (только персонажи, а не сами сообщения):

Gmail Тема сообщения Emoji Roach Motel

Посмотрев на источник этого скрипта , вы увидите, что есть два основных типа тараканов смайликов, которые вы найдете в письмах от злоумышленников (в настоящее время, к сожалению, включая eBay и Amazon):

  • Тараканы на основе HTML-изображений (включая ужасных анимированных) aka goomoji

  • Тараканы в Юникоде. Существует еще много смайликов (и других последовательностей Юникода, генерирующих изображения), которые спаммеры и другие бывшие маркетологи начинают использовать в строках темы электронной почты и которые gmail не конвертирует в изображения HTML. В некоторых браузерах они отображаются жирным шрифтом и цветом, что почти так же плохо, как анимация. Браузеры также могли бы анимировать их, но я не знаю, делают ли они это. Эти последовательности Unicode отображаются браузером как текст Unicode, поэтому точный внешний вид (цветной или нет, анимированный или нет, ...) зависит от того, какую систему рендеринга текста использует браузер. Внешний вид данного эмодзи Unicode также зависит от любых селекторов вариаций Unicode и модификаторов emojiкоторые появляются рядом с ним в последовательности кодовых точек Unicode. В отличие от эмодзи-спама на основе изображений, эти последовательности можно копировать и вставлять из браузера и в другие приложения в виде текста Unicode.

Для последнего типа пользовательский скрипт включает в себя регулярное выражение, предназначенное для захвата последовательностей Unicode, которые могут быть использованы маркетологами. Регулярное выражение выглядит следующим образом в ES6 Javascript (пользовательский скрипт переводит это в широко поддерживаемое регулярное выражение до ES6, используя потрясающий ES6 Regex Transpiler ):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.