Вопросы с тегом «unicode»

Unicode - это стандарт компьютерной индустрии для согласованного кодирования, представления и обработки текста, выраженного в большинстве мировых систем письма.



2
Как я могу установить кодировку VIM по умолчанию в UTF-8?
Я хотел бы внести свой вклад в проект с открытым исходным кодом, предоставляющий переведенные строки. Одним из их требований является то, что участники должны использовать UTF-8 в качестве кодировки для PO-файлов. Я использую VIM 7.3 на Linux. Как я могу быть уверен, что кодировка VIM установлена ​​в UTF-8, чтобы я …

2
Почему printf «сжимается» умлаут?
Если я выполню следующий простой скрипт: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Это печатает: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz то есть текст с умлаутами (например, ü) сокращается на один символ за умлаут. Конечно, у меня …
54 bash  unicode  printf 

6
Неверная фильтрация utf8
У меня есть текстовый файл в неизвестной или смешанной кодировке. Я хочу видеть строки, которые содержат последовательность байтов, которая не является допустимой UTF-8 (путем передачи текстового файла в какую-то программу). Эквивалентно, я хочу отфильтровать строки, которые являются действительными UTF-8. Другими словами, я ищу .grep [notutf8] Идеальное решение было бы переносимым, …

2
Какие шрифты хороши для символов Юникод
Поэтому я посмотрел на этот ответ по stackoverflow и понял, что мои шрифты не покрывают большую часть спектра unicode utf-8 (так как я получаю много квадратов). Кто-нибудь знает шрифт, который будет охватывать весь этот пост?
38 fonts  unicode 

1
Должны ли мы использовать символы UTF-8, такие как ⏰ в скрипте bash / shell?
Простой код здесь работает, как и ожидалось, на моей машине, если запущен с bash: function ⏰(){ date } ⏰ Может ли быть проблема для других людей, использующих это, или это универсально? Мне интересно, потому что я никогда не видел ничего подобного в другом исходном коде. Изменить: Есть неограниченные возможности, его …
36 bash  shell  unicode 

1
Как сделать так, чтобы tr знал не-ascii (юникод) символы?
Я пытаюсь удалить некоторые символы из файла (UTF-8). Я использую trдля этого: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Файл содержит несколько иностранных символов (например, «Латвийская» или «àé»). trкажется, не понимает их: он рассматривает их как не-альфа и удаляет тоже. Я попытался изменить некоторые из моих настроек локали: LC_CTYPE=C LC_COLLATE=C tr …


5
Обновил мой сервер arch linux и теперь я получаю tmux: нужен язык UTF-8 (LC_CTYPE), но есть ANSI_X3.4-1968
Я недавно обновил свой сервер Arch Linux, и во время этого процесса tmux обновился. Я использовал tmuxво время обновления и использовал его потом, но все во время одного сеанса SSH. Однако теперь, когда я пытаюсь выполнить любую tmuxкоманду, я получаю эту ошибку: tmux: need UTF-8 locale (LC_CTYPE) but have ANSI_X3.4-1968 …

4
Как указать символы, используя шестнадцатеричные коды в `grep`?
Этот вопрос был перенесен из Stack Overflow, потому что на него можно ответить в Unix и Linux Stack Exchange. Мигрировал 8 лет назад . Я использую следующую команду для определения диапазона набора символов для шестнадцатеричного кода от 0900 (вместо अ) до 097F (вместо व). Как я могу использовать шестнадцатеричный код …

3
Почему сортировка говорит, что ɛ = e?
ɛ(«Латинский эпсилон») - это буква, используемая в некоторых африканских языках, обычно для обозначения гласного звука в английском «кровать». В Юникоде это кодируется как U + 025B, очень отличное от повседневного e. Однако, если я sortследующее: eb ed ɛa ɛc кажется, что sortсчитает ɛи eэквивалентным: ɛa eb ɛc ed Что тут …
25 sort  locale  unicode 

6
В bash, как я могу преобразовать кодовую точку Unicode [0-9A-F] в печатный символ?
У меня есть список кодовых точек Unicode, но я не знаю "простого" способа конвертировать эти шестнадцатеричные значения в действительные символы, которые они представляют ... Я слышал, что Zsh имеет echo -e '\u0965', но я использую Bash 4.1. Есть ли что-то такое же простое, как метод zsh, для bash?
23 bash  unicode 

6
Преобразование форм нормализации Unicode в командной строке Unix
В Unicode некоторые комбинации символов имеют более одного представления. Например, символ ä может быть представлен как «ä», то есть кодовая точка U + 00E4 (два байта c3 a4в кодировке UTF-8) или как «ä», то есть две кодовые точки U + 0061 U + 0308 (три байта 61 cc 88в UTF-8). …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.