Я знаю, что это на самом деле не проблема, но мне было очень любопытно, почему это происходит.
Как воспроизвести это явление
Откройте gedit и введите что-нибудь (я использовал текст Lorem Ipsum с lipsum.com). Сохраните файл и закройте gedit.
Снова откройте его и нажмите «Открыть», затем «Другие документы ...». Нажмите на файл, который вы только что сделали. Прежде чем нажать кнопку «Открыть», нажмите «Кодировка символов» и выберите UTF-16.
Как только файл открывается, в редакторе появляется какой-то китайский язык, смешанный с некоторыми случайными не воспроизводимыми символами Юникода. Теперь вот где начинается действительно странная часть: откройте Google Translate и вставьте текст на китайском. Убедитесь, что вы выбрали «китайский» в качестве языка.
В зависимости от текста, вы почти всегда увидите где-нибудь понятный (и даже нормальный) английский. В моем случае я увидел: «Для получения дополнительной информации, пожалуйста, посетите наш сайт по адресу: www.globalcouncil.org», и «Это первый раз, когда вы пришли к нам в этой области. Вы можете посетить наш сайт «. Смотрите полный текст на Pastebin.
Другие наблюдения
- При переводе текста с использованием веб-сайта freetranslation.com часть текста появляется в обратном порядке, например: «изображение макрос 瑡 桴 礠 樠 с охотой» 慭, а цены - 挠 楬 挠 макрос Ɱ 挠 Одна общая фраза
- Этот текст, если его перевернуть, фактически совпадает с исходным текстом, который я набрал, когда кодировкой была UTF-8.
- Перевернутый текст, кажется, ведет себя так, как будто он на самом деле тоже задом наперед; когда я набираю что-то в конце текста, оно появляется в начале.
- Некоторые предложения звучат настолько нормально (а иногда и смешно), что кажется, что это не может быть причудами программного обеспечения для перевода, например: «Суп нельзя использовать при лечении острых или хронических обструктивных заболеваний легких». Это не было в оригинальном тексте, который я вставил.
- Я нашел этот вопрос в LinuxQuestions , который воспроизводит это явление, когда он помещается через Google Translate. Вот некоторые из понятных английских: «Это место, где вы можете найти свою любимую миску и миску».
Вопрос
Почему это происходит? И почему сгенерированные предложения звучат так реалистично? Это причуда гедита или переводчиков? (Было бы хорошо, если бы носитель китайского языка мог дать мне свое мнение.)
Это мой первый вопрос о суперпользователе, поэтому, пожалуйста, не обращайте на меня внимания. Заранее спасибо.