Допустимо ли загружать оскорбительный контент на GitHub? [закрыто]


12

Я разработал оскорбительный контент-контроль для своего сайта и хочу опубликовать его на GitHub . Тем не менее, исходный код содержит много оскорбительного, расистского и иного противного содержания.

Источник полностью документирован, но я хотел узнать ваше мнение о том, допустимо ли публиковать такие работы на GitHub или оставить массив строк на усмотрение читателя ?!


11
Ключевой вопрос, вероятно, «действительно ли это оскорбительно? Или это просто« диктаторский »?» который попадает в github TOS - §7 предполагает, что они могут (но не обязаны) удалить его. Возможно, вы захотите извлечь строки в другой файл, который затем будет зашифрован с помощью rot13, или что-то в этом роде, чтобы не повредить причинный браузер.

1
Я думаю, все в порядке, просто предупредите возможных читателей в Readme, в других GitHub Repos много оскорбительных слов. Кроме того, ваше дело добросовестно.
Jacktrades

5
Почему бы не поместить все слова в текстовый файл или базу данных и загрузить их во время выполнения. Затем поместите в заголовок файла симпатичный небольшой отказ от ответственности, что приведенный ниже текст не для слабонервных. Ваш код чистый, и вы можете использовать разные текстовые файлы для разных ситуаций?
День

@Sparticus спасибо за ваш комментарий. Я согласен и думаю, что это, вероятно, лучший подход для меня.
SimonGoldstone.com

5
Само по себе слово не оскорбительно. Намерение, стоящее за этим, делает его оскорбительным.
Каптан

Ответы:


45

Я должен не согласиться с решением ROT-13. Сокрытие своих запрещенные слов просто потому , что вид из них может обидеть кого - то это пустая трата времени.

Ваш словарь плохих слов / правил плохого слова в любом случае должен быть из отдельного файла (который может быть загружен во время выполнения или встроен как ресурс) . Запутывание этого файла просто затрудняет вам / другим разработчикам / вашим пользователям его изменение или исправление любых проблем. Кроме того, если бы я увидел файл «banned_words.txt» на моем жестком диске, я бы ожидал, что он будет содержать список оскорбительных слов.


Я согласен. Я не хочу запутывать слова.
SimonGoldstone.com

5
+1 @simon Такие списки уже появляются: github.com/snipe/banbuilder
dcaswell

2
@ Simon Я не имел в виду, что ваш проект не стоил того, просто Github позволяет людям хранить списки, как вы хотите. Другой ответ не имеет да или нет, я просто хотел подтвердить вам, что ответ был на самом деле да.
dcaswell

1
«заново изобретать колесо» - это часть обучения ... это то, чему учат в колледже.
WernerCD

2
Иногда вы сталкиваетесь с людьми с ... как бы сказать ... деликатными чувствами, которые могут оказать какое-то влияние на то, останется или не закончится распространение программы. Если вращение файла означает, что он остается, это помогает оператору достичь цели, состоящей в том, чтобы его код был включен и оставался на GitHub. Это не пустая трата времени в моей книге.
Blrfl

16

«Все проблемы в информатике могут быть решены с помощью другого уровня косвенности». ( От David Wheeler ).

Ваши варианты не ограничены ни загрузкой, ни загрузкой, если принять во внимание, что вы можете кодировать контент, чтобы он не мешал читателям.

  • Например, простое переключение на следующую букву (от A до B, от B до C и т. Д., Когда Z переходит на A для завершения кодирования) может превратить знаменитые четырехбуквенные слова в абсолютно безвредный Gvdl . Все, что вам нужно, чтобы использовать его в вашем приложении, - это сдвинуть его обратно в обратном направлении, к предыдущим буквам , с А, сместившимся на Z.

Как отмечалось в комментариях , подобный подход используется в шифре подстановки букв ROT13 , известном своим использованием «в качестве средства сокрытия ... оскорбительных материалов от случайного взгляда ...»

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


Для полноты рассмотрите возможность запуска своей программы проверки для закодированного словаря , чтобы убедиться, что выбранная кодировка не случайно превратила одно оскорбительное слово в другое.

При кодировании подобных вещей имеет смысл перепроверять, потому что никто не может достоверно предсказать вещи. В одном из моих прошлых проектов у нас был довольно серьезный перерыв в работе почты, когда неправильно настроенная программа проверки начала обнаруживать оскорбительный контент в случайных последовательностях символов (в uuencoded контенте ZIP-архивов).


По сравнению с передачей простого текста, Gvdl , кодирование имеет существенное преимущество , заключающееся в полном избежании юридических проблем и всех связанных с этим рисков и зависимостей .

Просто подумай об этом. Скажем, особые условия обслуживания в определенном хранилище разрешают мой контент, хорошо.

Но что, если они решат изменить TOS ? Или, что, если я решу перейти на другой репозиторий с несовместимыми условиями. Что я собираюсь делать?

Заметьте, кстати, что даже находясь в «дружественном» хранилище, здесь и сейчас, все еще не полностью безопасно.

Что если кто-то не сможет загрузить мой контент из-за странного веб-фильтра ? Готов ли я отвечать на жалобы пользователей и объяснять, как исправить фильтр? Их фильтр ...

... Видите ли, я бы лучше подумать дважды, прежде чем я решу против кодирования. И даже если бы я решил, я бы удостоверился, что у меня есть очень, очень веская причина для этого.


6
Rot13 является своего рода стандартом де-факто для этого. Двойная гниль13 еще лучше. :-)
Blrfl

5
@Blrfl точно так же, как тройной DES лучше, чем DES, тройной рот13 - это путь.

1
Я думаю, что есть плагины для многих редакторов, которые делают редактирование файлов rot13 не сложнее, чем редактирование любого другого файла в специализированном формате
JoelFan

2
@Simon - это не так уж и плохо, что rot13 - это омрачение, а скорее просто стандартный способ тривиального сокрытия текста. Поймите, что некоторые брандмауэры могут быть настроены на блокировку определенных шаблонов символов, что затрудняет доступ к вашему тексту для функциональности программы. Скорее всего, проблема не в оскорбительности, а в других технологических препятствиях, которые могут не осознавать разницу между «чем-то, что вы хотите загрузить» и «чем-то, что вы хотите заблокировать». Да, они могут получить почтовый индекс, но они не смогут клонировать, разветвляться или толкать.

2
@ThomasEding Цезарь сдвиг шифра на одну букву. Первым символом изначально является «F».
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.