Вопросы с тегом «character-encoding»

Вопросы, которые касаются различных представлений символов и наборов символов, таких как: ASCII, UTF-8, EBCDIC и другие. Часто встречается при перемещении файлов между операционными системами, которые кодируют новые строки с возвратом каретки и / или символами новой строки.

2
Как я могу установить кодировку VIM по умолчанию в UTF-8?
Я хотел бы внести свой вклад в проект с открытым исходным кодом, предоставляющий переведенные строки. Одним из их требований является то, что участники должны использовать UTF-8 в качестве кодировки для PO-файлов. Я использую VIM 7.3 на Linux. Как я могу быть уверен, что кодировка VIM установлена ​​в UTF-8, чтобы я …

6
Неверная фильтрация utf8
У меня есть текстовый файл в неизвестной или смешанной кодировке. Я хочу видеть строки, которые содержат последовательность байтов, которая не является допустимой UTF-8 (путем передачи текстового файла в какую-то программу). Эквивалентно, я хочу отфильтровать строки, которые являются действительными UTF-8. Другими словами, я ищу .grep [notutf8] Идеальное решение было бы переносимым, …

4
Как называется символ ^ M?
TexPad создает его. Я знаю, что это под каким-то тупиком. Я просто не могу вспомнить, это имя. Синий символ: Я просто хочу массово удалить их из моего документа. Как вы можете напечатать это?

4
эхо-байты в файл
Я пытаюсь подключить Rasberry Pi к некоторому дисплею, используя шину i2c. Для начала я хотел написать что-то вручную, в частности байты, в файл. Как вы пишете конкретные байты в файл? Я уже прочитал это, и я решил, что моя проблема должна быть решена примерно так echo -n -e \x66\x6f\x6f > …

3
Как я могу проверить кодировку текстового файла ... Это действительно, и что это?
У меня есть несколько .htmфайлов, которые открываются в Gedit без каких-либо предупреждений / ошибок, но когда я открываю эти же файлы Jedit, он предупреждает меня о недопустимой кодировке UTF-8 ... В метатеге HTML указано «charset = ISO-8859-1». Jedit допускает Список резервных кодировок и Список авто-детекторов кодирования (в настоящее время "BOM …

3
Какая кодировка кодировки используется для имен файлов и путей в Linux?
Зависит ли это от того, какую файловую систему я использую? Например, ext2 / ext3 / ext4, а также что происходит, когда я вставляю один из этих «веселых» компакт-дисков с ISO 9660? Я слышал, что POSIX содержит какие-то спецификации для кодировки имен файлов в кодировке? По сути, мне интересно, если я …

2
find (1): как реализован подстановочный знак «звезда» для сбоя некоторых имен файлов?
В файловой системе, где имена файлов находятся в UTF-8, у меня есть файл с ошибочным именем; оно отображается как:, D�sinstallerфактическое имя в соответствии с zsh:, D$'\351'sinstallerLatin1 для Désinstaller, само по себе французское варварство для «удаления». Zsh не совпал бы с этим, [[ $file =~ '^.*$' ]]но совпал бы с глобусом …

4
Как указать символы, используя шестнадцатеричные коды в `grep`?
Этот вопрос был перенесен из Stack Overflow, потому что на него можно ответить в Unix и Linux Stack Exchange. Мигрировал 8 лет назад . Я использую следующую команду для определения диапазона набора символов для шестнадцатеричного кода от 0900 (вместо अ) до 097F (вместо व). Как я могу использовать шестнадцатеричный код …

3
Понимание кодировки имени файла Unix
Мне трудно понять, как работает кодировка имени файла. На unix.SE я нахожу противоречивые объяснения. Имена файлов хранятся в виде символов Процитирую другой ответ: Несколько вопросов о кодировке символов файловой системы в Linux. […] Как вы упоминаете в своем вопросе, имя файла UNIX - это просто последовательность символов; ядро ничего не …

5
Почему некоторые символы отображаются в Chrome как квадраты?
Например, в инструментах разработки я получаю что-то вроде: Некоторые из этих квадратов находятся в конце строк, сначала я думал, что это возврат каретки, но оказалось, что это не так. Кроме того, квадраты появляются после =или >во многих местах, где нет новой строки, и просмотр файла в шестнадцатеричном редакторе показывает, что …

2
tr жалуется на «недопустимую последовательность байтов»
Я новичок в UNIX и использую «Командную строку Mac OS X» Кирка МакЭлхарна, чтобы научить себя некоторым командам. Я пытаюсь использовать trи grepтак, чтобы я мог искать текстовые строки в обычном документе MS-Office Word. $ tr '\r' '\n' < target-file | grep search-string Но все, что он возвращает, это: Illegal …

4
идентифицировать файлы с не-ASCII или непечатаемыми символами в имени файла
В каталоге размером 80 ГБ с приблизительно 700 000 файлов в имени файла есть имена файлов с неанглийскими символами. Помимо трудоемкого просмотра списка файлов: Простой способ перечислить или иным образом идентифицировать эти имена файлов? Способ создания печатных символов не на английском языке - тех символов, которые не перечислены в диапазоне …


5
Преобразование файла UTF-8 в ASCII (наилучшее усилие)
У меня есть файл в UTF-8, который содержит тексты на нескольких языках. Во многом это имена людей. Мне нужно преобразовать его в ASCII, и мне нужно, чтобы результат выглядел максимально прилично. Есть много способов приблизиться к преобразованию из более широкой кодировки в более узкую. Простейшим преобразованием было бы заменить все …

6
Генерация случайного пароля; почему это не портативный?
Я хочу создать случайный пароль, и я делаю это так: </dev/urandom tr -dc [:print:] | head -c 64 На моем ноутбуке, на котором работает Ubuntu, он производит только печатные символы, как и предполагалось. Но когда я захожу на сервер моей школы, на котором работает Red Hat Enterprise Linux, и запускаю …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.