Клиент хочет, чтобы экран работы машины для порнографии. Является ли это возможным?


30

Давний клиент попросил нас помочь экрану своих работ машины для порнографии. Они беспокоятся об ответственности, если чувствительные материалы были найдены. Их основные проблемы (по понятным причинам) - это видео, аудио и файлы изображений. Если возможно, они также хотели бы сканировать текстовые документы на предмет неприемлемого содержания. У них есть иерархия не предназначенного для работы контента, начиная с явно нелегального (мне не нужно перечислять детали), переходя к явно оскорбительным, а также включая вещи, которые могут быть оскорбительными для некоторых - подумайте о рекламе нижнего белья, шутливых карточках с участием трещины в заднице и все, что связано с Хоуи Манделем.

Мои вопросы:

  • Это этично? Я думаю, это потому, что каждый сотрудник юридически согласен с тем, что их рабочая машина принадлежит компании и подлежит поиску. Показ не должен проводиться на персональных машинах, запущенных на работу.
  • Это возможно? Я много занимался обработкой / индексацией изображений, но это кажется совершенно новым миром сложности.
  • Любые ссылки на успешные методы для обнаружения порно?
  • Уместно ли мне архивировать результаты при обнаружении чего-либо?

29
Чья порно будет использовать , чтобы проверить это?
ChaosPandion

12
Я хочу быть тестером для этого проекта!
Mayank

56
Создайте скрипт, который публикует все найденные изображения на 4chan; если другие члены ответить «Moar!», вы знаете , это порно. Если скрипт будет забанен, вероятно, это CP.
user281377

8
Вы должны были бы думать, что уже есть миллион доступных коммерческих продуктов для этого.
GrandmasterB

34
Честный вопрос: действительно ли это вероятная проблема? Порно на рабочем компьютере? Я имею в виду ... кто это делает? Кроме того, как они намерены обращаться случайное порнографического содержания? Мой GF фактически был вирус на свой рабочий компьютер в последнее время, которые перенаправлены произвольные запросы Google к порносайтам и очень часто я случайно набрать «python.com» [NSFW!] Вместо «python.org» ... Более того, если это на самом деле проблема, я думаю, что это выдает более фундаментальную проблему доверия и / или профессионализма в компании. Адрес это вместо поиска компьютеров.
Конрад Рудольф

Ответы:


125

Вы можете сделать это с 90% Headology , 10% программного обеспечения.

Во-первых, спокойно сканируйте компьютеры сотрудников, создайте базу данных файлов и размеров для каждого сотрудника.

Тогда утечка памятку , что все средства ПК будут проверяться на наличие сомнительного содержания, т.е. Боссы имеют Shazam , как программа , которая может идентифицировать порно и т.д.

Затем, через пару дней, снова просканируйте компьютеры на наличие файлов и размеров. Посмотрите на любые удаленные файлы, это файлы фильмов или изображений? Тогда это те сотрудники, за которыми нужно следить.

Регулярно сканируйте компьютеры этих сотрудников на наличие изображений и фильмов и вручную проверяйте их на предмет сомнительного содержания.


9
И +1 за упоминание головы.
TRiG

5
@Binary: двухэтапный подход действительно впечатляет.
Матье М.

2
+1от меня за ссылку на бабушку!
ВОО

2
@ Аноним Пока ты на этом. Создайте графический интерфейс в Visual Basic, чтобы увидеть, можете ли вы отслеживать IP-адрес. youtube.com/watch?v=hkDD03yeLnU . Серьезно, хотя, это - способ удивительной техники поставить некоторый второсортный сценарий телешоу.
Эван Плейс,

2
какая злая идея! люблю это
Chani

75

Это очевидная задача нейронной сети. Для начала вам понадобится большой обучающий набор изображений, отобранный специалистами вашей компании .....

Более эффективное решение объявить, что вы будете проверять всякие машины для порно СЛЕДУЮЩЕЙ недели / месяца / что угодно, то написать простое приложение, которое только осуществляет диск. Я гарантирую, что машины будут очищены к тому времени.


ps - пара «серьезных» моментов - вы на самом деле ничего не хотите найти.

Если вы обнаружите пару изображений в кеше браузера, возможно, они столкнутся с плохой ссылкой или изворотливым всплывающим окном - помните, что учитель выстрелил по whitehouse.com? Если вы уволите / дисциплинируете их за это, то от работников / профсоюза будет отрицательная реакция. Как будет работать ваша компания, если каждый щелчок должен быть представлен на утверждение в юридический отдел, прежде чем ваши сотрудники изучат вопрос или проверит цену в Интернете?

Если вы нашли пачку порно на машине, как вы собираетесь доказать, что был поставлен там что сотрудник? Есть ли у вас системы безопасности и аудита, которые будут стоять в суде? Используете ли вы (или даже знаете) операционную систему, в которой системный администратор не может поместить их туда и сделать так, чтобы она выглядела как файлы пользователя?

Кроме того, в моем опыте наиболее распространенные места для порно тайников находятся на ноутбуках CxOs и старших VPs.

Гораздо лучше просто организовать исчезновение файлов раньше времени.


+1 - хотя я бы сочетал это с проверкой на основе% людей. Возможно случайный выбор 0,1% рабочих станций для реальной проверки.
Дрю

@nikie: Мартин шутил насчет тренировочного набора.
Эндрю Гримм

Это очень забавное и точное решение :)
crosenblum

10
Подождите. Как вы знаете , я кладу порно притон на ноутбуке генерального директора?
Яап

1
Я бы удивился , если бы люди действительно удалить все свои порно, столкнувшись с перспективой их машина проверяется. Программист, вероятно, сделал бы это, но другие люди IME действительно, странно, относятся к таким вещам. Тем не менее, вы можете объединить это с идеей Binary и присмотреться к тем машинам, на которых удалено много МБ. Тем не менее, +1от меня за наблюдение, что вы действительно не хотите что-то найти.
ВОО

8

Такой подход к контролю, безусловно, болезнен как для сотрудников, так и для ИТ-специалистов. Как только что-то попадает внутрь машины сотрудника, нет точного способа обнаружить это. Вы должны остановить это, входя в машину во-первых.
Самая известная практика для этого - это контроль сайтов / доменов, которые можно посетить. Такой список должен быть доступен где-то в сети. Кроме этого, вы также можете отслеживать количество изображений, видео, загруженных сотрудником, и откуда оно пришло.
Есть вероятность, что материал может быть получен не из сети, например с внешнего жесткого диска. Раз в месяц может происходить случайное сканирование системы, где вы можете случайно выбрать некоторые видео и изображения и проверить их вручную. Не уверен, как это можно сделать. Но автоматизация проверки изображений и видео, безусловно, выходит за рамки и будет ошибочной.
На самом деле, я не очень люблю ограничивать сотрудников от личных дел. Вы должны доверять своим сотрудникам за это. Ваши сотрудники должны быть достаточно заняты в офисе, чтобы у них не было на это времени. Больше беспокойства вызывает то, что работник не выполняет свою работу правильно? Или он установил взломанное или взломанное программное обеспечение?


1
Я согласен, что у разработчиков и других творческих людей не должно быть заблокированных машин. Однако - и поверьте мне, когда я это говорю, - когда у вас более 200 сотрудников, обрабатывающих документы рабочего процесса, вы не хотите давать этим парням что-нибудь, что может их отвлечь, включая браузер. Да, 90% людей трудолюбивы и не будут отвлекаться, но это означает, что у вас будет более 20 гоблитов, которые потянутся и будут непродуктивными.
Binary Worrier

6
эти 10% будут непродуктивными в любом случае. Если не просматривать веб-сайты, то играть в игры, читать, бездельничать, сидеть скучно и т. Д.).
jwenting

2
Люди либо выполняют свою работу, либо нет. Их легче обнаружить, когда у вас есть 200, выполняющих аналогичные задачи, которые можно измерить.
JeffO

2
В США существует юридические вопросы , связанные с порно на компьютерах компании, и есть действительно серьезные правовые вопросы , связанные с детской порнографией. Это безопаснее , чтобы иметь не-порно политику и принимать меры , чтобы сохранить его.
Дэвид Торнли

7

На рынке есть ряд продуктов, которые выполняют «фильтрацию контента» различных форм. (Поиски в Google по некоторым очевидным терминам приводят к очевидным кандидатам.) Вероятно, лучше использовать один из этих продуктов, чем создавать много программного обеспечения для сканирования / фильтрации с нуля. Другой вариант - просто посмотреть на границы; например, отслеживая внешние электронные письма и веб-трафик. Опять же, есть продукты, которые делают такие вещи.

Хотя нет никаких сомнений в том, что для компании этично сканировать свои компьютеры на «плохие вещи», это не означает, что проблем нет.

Первый выпуск:

  • Определение того, что является и что не является «нежелательным содержанием», является субъективным.
  • Программное обеспечение для обнаружения изображений, видео, содержащих (скажем, «изображения обнаженного тела»), (AFAIK), вероятно, будет ненадежным, что приведет к ложным срабатываниям и ложным отрицаниям.

Итак ... это означает, что кто-то в организации вашего клиента должен проверить "хиты". Это стоит денег.

Вторая проблема: может быть невинное объяснение. Файл мог быть загружен случайно, или он мог быть установлен мстительным сотрудником. Если есть невинное объяснение, организация клиента должна быть осторожна с тем, что они делают / говорят. (Хорошо, это не ваша проблема, но вы можете справиться с обратной промывкой.)

Третий вопрос: несмотря на то, что компания имеет право отслеживать нежелательные материалы, многие сотрудники сочтут это неприятным. И если они слишком далеко, это отразится на моральном состоянии сотрудников. Некоторые сотрудники будут «гулять». Другие могут предпринять акцию протеста ... например, пытаясь создать много ложных срабатываний. (Опять же, не совсем ваша проблема, но ...)

Четвертый вопрос: люди могут скрывать нежелательные материалы, шифруя их, помещая их на переносные или съемные носители и т. Д. Люди могут подделывать метаданные, чтобы они выглядели так, как будто кто-то другой несет за них ответственность.


1
ОП сказал, что это было связано с вопросами ответственности, что имеет большой смысл в США. Это означает, что нужно избавляться от компьютеров, не обязательно обвинять людей.
Дэвид Торнли

Я бы сказал, что это было нечто большее. Рассмотрим конец списка содержимого «не для работы» в вопросе. Похоже, у кого-то есть «повестка дня» ...
Стивен С.

@ Давид: ВСЕГДА обвинять людей. Если у вас есть потенциальная проблема с ответственностью, то поиск виновного («этот человек действовал в нарушение политики компании, и мы можем это доказать, поэтому несет личную ответственность, а не мы как компания») становится стандартным способом работы. На самом деле это то, что большинство людей на ответственных должностях во многих компаниях тратят большую часть своего времени, пытаясь найти людей, виновных в том, что может пойти не так, и гарантируя, что никто не сможет обвинить их в любой беде, с которой они столкнулись. в.
Jwenting

6

О правовых аспектах во Франции:

Босс владеет компьютерами и подключением к Интернету: он может делать все, что ему угодно.

НО, конфиденциальность работника не может быть нарушена. Если каталог на компьютере помечен как ЛИЧНЫЙ, босс не имеет права его сканировать.

Единственный способ обойти это, чтобы получить элементы доказательств того, что работник сохраняет незаконные материалы и получить суд запросить проверку компьютера (Обратите внимание, что порнография не является незаконной во Франции.)


За исключением случаев, когда материал защищен авторским правом, любой может считаться кражей.
TRiG

6
Во Франции существует понятие исключения частной копии: вам не разрешено копировать материалы, защищенные авторским правом, но владельцы авторских прав не могут требовать чего-либо, если ваша копия используется в личных целях.
Mouviciel

Я хочу жить во Франции ... только я не говорю по-французски!
анонимный тип

5

Если сотрудники согласились с тем, что их рабочая машина принадлежит компании и подлежит поиску, то да, это законно. Для доказательства архивация файлов, скорее всего, будет необходима.

Что касается того, как на самом деле найти материал. Ты мог бы:

  1. В первую очередь, сканировании имен файлов для определенного набора слов (порно, лесбиянок и т.д.)
  2. Сканирование текстовых документов на одинаковый набор слов
  3. Для изображений вы можете найти средний цвет изображения, и если этот цвет находится в пределах диапазона, который большинство будет называть «телесным», то пометьте изображение (кто-то, дважды проверив эти помеченные изображения, скорее всего, будет необходим ). Не хотел бы сообщать о ком-то за изображение, которое заканчивается семейной фотографией с пляжа.

Если вы сканируете файлы по мере их поступления на компьютер (например, загружаете программу на каждую рабочую машину и регистрируете отмеченные дела в центральной базе данных), то я не думаю, что это будет слишком навязчиво (кроме вопиющего недоверия к работодатель явно имеет для своих работников).

С видеофайлами я не уверен на 100%. Возможно, такой же подход, как и при сканировании изображения (выбирайте случайные кадры и сканируйте для получения определенного уровня «телесного» цвета).

Сканирование аудиофайлов похоже на то, что оно попадет в распознавание речи, что представляет собой целую «черную червьку». Сканирование имени файла, однако, будет простым и может быть выполнено как с документами, изображениями и видео.


Да, я думал в том же духе. Плотские тона жестки со всеми разновидностями. Не говоря уже о большом старом выстреле чьей-то головы (например, моем граватаре), вероятно, вызовет предупреждение о соотношении мяса и не мяса. Впрочем, потрясающее начало.
Скудный Роджер

слишком большой риск ложных срабатываний (частично зависит от бизнеса).
jwenting

Существует цветовое пространство, в котором большинство человеческих оттенков кожи попадают в заданный диапазон. YCbCr если я правильно помню. Разрежьте изображение на блоки, и если в большинстве блоков среднее значение пикселя попадает в диапазон, пометьте его как фотографию «обложки».
Vitor Py

Есть еще одна проблема. Человек, которому поручено проверить видео, может подать в суд на вас. Я, конечно, не хотел бы делать это. (Не все порно по вкусу всем людей.)
Кристофер Махан

Green Dam (да, от большого правительства брата на востоке) подразумевается использовать OpenCV для его возможностей обнаружения лица. Это все еще будет генерировать много ложных срабатываний, даже в сочетании с определением тона кожи.
Руон

4

Как сказал @Ryan, анализ изображений может сосредоточиться на анализе цвета.

Технико-экономическое обоснование? Моя сестра работает в области прав-в, где они получают некоторую форму аудита каждый год, и как только это было для порно. Она (геофизик) имела несколько ложных срабатываний (розовые камни).


4

Существует значительное, недавнее исследование обнаружения порнографии с использованием традиционных методов классификации. Примеры доступны здесь и здесь .


3
  • Это этично?

Зависит от реализации и разумных ожиданий сотрудников. Например, если ваше программное обеспечение сканирует любой компьютер, подключенный к сети, есть дополнительное требование, которое необходимо для предотвращения подключения неавторизованных компьютеров. (Возможно, это должно быть очевидно, но это часто упускается из виду в сетях, которые я видел).

  • Это возможно? Я много занимался обработкой / индексацией изображений, но это кажется совершенно новым миром сложности.

Возможно ли тестирование на наркотики каждому сотруднику? Может быть и так, но я ставлю под сомнение его ценность. Я бы рандомизировал это. Сообщите сотрудникам, что их машины могут быть отсканированы на предмет нежелательного содержимого в любое время.

  • Любые ссылки на успешные методы для обнаружения порно?

Я не касаюсь этого. Я не думаю, что смогу сдержать свое чувство юмора. Но остерегайтесь проблемы Сканторпа при поиске текста.

  • Уместно ли мне архивировать результаты при обнаружении чего-либо?

Это касается меня больше всего, и я бы попросил адвоката. Я подозреваю, что если вы обнаружите нелегальный контент, вы можете быть юридически обязаны раскрыть его. Это плохо, особенно если пользователь был разоблачен по собственной вине. Вам (клиенту) понадобится реальная юридическая консультация о том, как с этим справиться. Привлекайте HR и юристов.


2

С чисто технической точки зрения: это звучит как проблема распознавания категории объекта. Я никогда не делал ничего подобного, но из того, что я прочитал, современные системы распознавания категорий работают так:

  • Сначала вы ищете большое количество точек интереса (например, с помощью детектора углов Харриса, экстремальных точек фильтров LoG / DoG в пространстве шкалы; некоторые авторы даже предлагают выбирать случайные точки)
  • Затем вы применяете функцию преобразования к каждой точке (что-то вроде SIFT, SURF, GLOH или многих других)
  • Объедините все функции, которые вы нашли в гистограмму (Bag-Of-Features)
  • Используйте стандартные алгоритмы машинного обучения (например, машины опорных векторов), чтобы изучить различия между категориями объектов, используя большое количество обучающих изображений.

2

Операционная система каждого компьютера, вероятно, была установлена ​​с образа диска.

  1. начните с образа диска и получите список файлов, которые вам, вероятно, не нужно сканировать.
  2. получить список всех остальных файлов на каждом ПК.
  3. вытащить актуальные файлы из 10-20 случайных машин и использовать в качестве тестового стенда
  4. поиск предметов в ненормативной лексике и сомнительном словарном слове (горячие, кувшины, «едва законный», шутка и т. д.) словарь
  5. Посмотрите видео - у кого-нибудь должно быть видео?
  6. Просмотр фотографий
  7. Любые сомнительные видео или графические файлы могут быть использованы для поиска других машин

Потребуется поймать одного или двух сотрудников, прежде чем кто-либо положит что-нибудь на их рабочий компьютер.

Взимайте нецензурную сумму за эту услугу. Я буду Zappos никогда бы не сделал это со своими сотрудниками.


2

Предполагая, что вы являетесь администратором домена в сети.

  1. C $ в каждый пользовательский настольный компьютер.
  2. Скопируйте порно файлы в личную частную акцию.
  3. Удалить из исходного местоположения.
  4. Сделать попкорн.
  5. Полный подробный анализ всех «доказательств».

1

Я просто хотел прокомментировать, но только 1 повтор, поэтому я не могу.

В случае Gravatar, вы можете добавить функцию для фильтрации из списка чистых сайтов в интернет-кэш-хранилищах. IE Gravatar и другие сайты, с которых вы не хотите ложных срабатываний. Вы также можете отфильтровать такие вещи, как обои для рабочего стола. Если они показывают порно на рабочем столе можно подумать, что люди заметили бы за пределами вашей проверки.


1

Такие вещи никогда не работают надежно. Вы можете использовать черный список, чтобы блокировать домены либо по имени, либо по включению в какой-либо список (обычная практика). Но эти списки никогда не являются полными, и блокировка имени на основе критериев может привести к множеству ложных срабатываний.

Вы можете заблокировать слова, появляющиеся в тексте сайтов, но опять же это может привести к ложным срабатываниям (и становится очень медленным, так как вам нужно анализировать каждый бит данных, проходящий через вашу сеть, чтобы обнаружить «непослушные биты»).

Вы можете заблокировать изображения (и, возможно, сайты, содержащие их), которые показывают более определенного процента скин-тонов. Но опять же это приводит ко многим ложным срабатываниям. Университетский медицинский отдел, блокирующий медицинскую энциклопедию с изображениями конечностей и туловища, показывающими раны и кожные заболевания, является хорошо известным примером этого. И, конечно, это было бы расизмом, так как это блокировало бы только некоторые тона кожи. Если вы блокируете цвета соответствия кавказских кож, всегда есть порно с использованием черных актеров, например.

Лучше всего просто довериться своим сотрудникам и иметь политику на случай, если это доверие нарушено.


персональный прокси-сервер, зашифрованный скрытый раздел, виртуальные машины. Всегда есть способ спрятать вещи. Конечно, есть Android-смартфоны с 3g. Наконец, я проверил, что у работодателя нет возможности остановить своего сотрудника, который смотрит что-либо на своем телефоне со своей пропускной способностью.
Кристофер Махан

Вот почему технические средства бесполезны, конечно, без политики. Если люди знают , что разрешено , а что нет (и я не могу думать о образованном человеке , который бы использовать рабочую машину для порно, даже без такой политики, но это другой вопрос) большинство будет придерживаться этого. Те, кто этого не сделает, рано или поздно узнают, есть ли технические средства или нет (скорее всего, кто-то увидит на экране что-то, чего они не должны были видеть, проходя мимо).
jwenting

1

Я не знаю, должен быть средний ответ, который не так агрессивен, но решает реальную проблему, ОТВЕТСТВЕННОСТЬ.

Попросите их подписать отказ, который освобождает компанию от ответственности за незаконные вещи, найденные на рабочих компьютерах, которые не связаны с работой.


Я не думаю, что отказ будет работать в США. Я не знаю о других странах.
Дэвид Торнли

Почему бы это не сработало? Если у пользователя есть возможность загружать контент, устанавливать программное обеспечение, то он, естественно, берет на себя ответственность за него.
crosenblum

И, если компания имеет возможность отфильтровать порнографию, которая , как правило , предполагается, и не, это отчасти ответственность компании.
Дэвид Торнли

не везде В некоторых странах компания несет ответственность за то, что происходит с любым принадлежащим им оборудованием, независимо от того, использовал ли сотрудник его по прямому назначению или нет. Это в некоторой степени относится и к США, на самом деле были попытки предъявить иск компаниям за незаконное использование их продуктов после того, как эти продукты были проданы на законных основаниях (см., Например, постоянные судебные иски против производителей огнестрельного оружия за ответственность, когда их продукты используется в преступлениях, исках, которые, к счастью, обычно выбрасывают, но, к сожалению, не всегда).
jwenting

1
  1. сообщить пользователю URL считается взрослым - это делает прокси Bluecoat .
  2. Лицензируйте то, что Google делает в своем поиске изображений http://code.google.com/apis/safebrowsing/ http://www.google.com/search?q=google+image+recognition+api
  3. просканируйте компьютер на предмет отсутствия предварительно согласованного списка.

1

Изображение и анализ контента, чтобы определить различия между изящной фотографией человека, купальником фотографии, обнаженной фотографией, изображениями порнографии ... насколько я знаю, далеко не достаточно сложного, чтобы сделать в программном обеспечении в одиночку.

К счастью, краудсорсинг должен быть здесь полезен, как предложил @ammoQ в комментарии. Однако я не верю , что члены 4chan или любой другого форума оценил бы огромное количество не являющиеся -порнографических изображений, такие как общие веб - графики для кнопок, рамки, реклама и т.д. будут опубликовано.

Моя рекомендация - изучить существующие краудсорсинговые решения, такие как Amazon Mechanical Turk . (Однако сроки службы могут явно запретить участие порнографического содержания, поэтому посоветуйте вам , возможно , придется найти другое решение или свернуть свой собственный.)

Чтобы сделать краудсорсинг возможным, ваше программное обеспечение должно быть готово выполнить некоторые или все из следующих действий:

  • Храните информацию, которая связывает контент с компьютером, с которого он поступил
  • Определите точные дубликаты по всему инвентарю и удалите их (но информация о происхождении сохраняется)
  • Уменьшите изображение до некоторого размера, возможно, 320x200, что достаточно для идентификации содержимого изображения без сохранения ненужных деталей и неиспользования пространства / полосы пропускания.
  • Создавайте неподвижные изображения видеоконтента через определенные промежутки времени и применяйте то же правило понижающей дискретизации

Наконец, база данных уменьшенных изображений, представляющих исходное изображение и видеоконтент, проверяется пользователями (или назначенной командой, если у вас есть ресурсы) в соответствии с кодексом поведения вашей компании. Программа или интерфейс могут отображать одно изображение за раз или экран миниатюр - все, что вы считаете лучшим для получения точной информации.

Идентификационные данные компьютера, с которого поступили изображения, должны быть абсолютно секретными и неизвестными лицам, оценивающим данные. Кроме того, оно должно быть рандомизировано, и каждое изображение, вероятно, проверяется более одного раза, чтобы устранить смещение.

Та же самая техника могла бы использоваться для текста, но сначала контент мог быть оценен ранжированием ключевых слов, который удаляет большую часть текста из обзора краудсорсинга Классификация длинного документа, конечно, займет больше времени, чем классификация изображения.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.