Вопросы с тегом «unicode»

Unicode - это стандарт компьютерной индустрии для согласованного кодирования, представления и обработки текста, выраженного в большинстве мировых систем письма.

6
Может ли профиль терминала Gnome использовать UTF-8 по умолчанию?
Я нахожусь в системе Ubuntu (я думаю). У меня нет root, поэтому я не могу изменить локаль. Я хочу, чтобы мой профиль терминала по умолчанию использовал UTF-8 по умолчанию. Должен быть способ сделать это, либо .gconf/apps/gnome-terminal/где-то в каталоге, либо в переменной окружения, либо во что-то еще. Тем не менее, я …

3
Есть ли универсальный способ написания символов Unicode?
Иногда я хочу написать специальные символы Unicode, такие как em-dash (-), в различных программах, таких как vim, Chrome (как сейчас!) Или LibreOffice. В LibreOffice я могу добиться этого через специальное диалоговое окно, расположенное в меню «Вставка». Другие программы, похоже, не имеют встроенного способа. Мое решение в этих случаях - найти …


6
Как правильно распаковать архив ZIP с именами на иврите?
Кто-то прислал мне ZIP-файл, содержащий файлы с ивритскими именами (и созданный в Windows, не уверен, каким инструментом). Я использую LXDE на Debian Stretch. Менеджер архивов Gnome распаковывает файл, но ивритские символы искажены. Я думаю, что я получаю октеты UTF-8, расширенные до символов Юникода, например, у меня есть файл, имя которого …

2
Почему некоторые символы юникода не выводятся на мой терминал?
Я использую Arch Linux с простым терминалом, использующим шрифт Adobe Source Code Pro. Мой язык правильно установлен LANG=en_US.UTF-8. Я хочу напечатать символы Unicode, представляющие игральные карты, на мой терминал. Я использую Википедию для справки . Символы Юникода для карточных мастей работают нормально. Например, выдача $ printf "\u2660" печатает черное сердце …
16 bash  fonts  unicode  printf 


3
Как преобразовать смайлик, указанный кодом U + xxxxx, в utf-8?
Смайлики, по-видимому, указываются с использованием формата U + xxxxx, где каждый x является шестнадцатеричной цифрой. Например, U + 1F615 является официальным кодом Консорциума Unicode для «запутанного лица» 😕 Как я часто путаюсь, я очень привязан к этому символу. Представление U + 1F615 сбивает меня с толку, потому что я думал, …

2
coreutils, которые знают?
Когда я использовал cutсегодня, я обнаружил, что это не символ UTF-8 как символ, а 3 символа, потому что его длина составляет 3 байта. Похоже, что это в целом верно для многих инструментов. Существуют ли версии с поддержкой coreutilsUTF-8? Мой localeвывод: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" LC_COLLATE="en_US.UTF-8" LC_MONETARY="en_US.UTF-8" LC_MESSAGES="en_US.UTF-8" LC_PAPER="en_US.UTF-8" LC_NAME="en_US.UTF-8" LC_ADDRESS="en_US.UTF-8" …
16 unicode  coreutils  cut 

4
Найти лучший шрифт для рендеринга кодовой точки
Как найти подходящий шрифт для рендеринга кодовых точек Юникода? gnome-terminalВыясните, что такие символы, как «🉃 ⼼ 😻🕲🝤», могут отображаться с использованием шрифтов, таких как Symbola, а не моего терминального шрифта или запасного варианта кода в квадрате (????). Как ?
16 fonts  unicode 

3
Не можете использовать `cut -c` (` --characters`) с UTF-8?
Команда cutимеет опцию -cдля работы с символами вместо байтов с опцией -b. Но это, похоже, не работает, в en_US.UTF-8локали: Второй байт дает второй символ ASCII (который точно так же кодируется в UTF-8): $ printf 'ABC' | cut -b 2 B но не дает второго из трех греческих не-ASCII символов в …

5
Получить ширину отображения строки символов
Что было бы наиболее близко к переносимому способу получения ширины дисплея (по крайней мере, на терминале (тот, который отображает символы в текущей локали с правильной шириной)) строки символов из сценария оболочки. В первую очередь меня интересует ширина неконтролирующих символов, но приветствуются также решения, учитывающие управляющие символы, такие как возврат, возврат …

2
UTF 8 имен файлов?
В операционных системах на основе Unix допустимы имена файлов utf6? Если это так, мне нужно сделать что-то особенное, чтобы записать файл на диск. Позвольте мне объяснить, что я надеюсь сделать. Я пишу приложение, которое будет передавать файл через ftp в удаленную систему, но имя файла динамически устанавливается с помощью некоторого …

2
grep: Найти все строки, содержащие японские кандзи
В огромном текстовом файле UTF-8 я хочу показать все строки, которые содержат японские кандзи . Какое grep(или другое) выражение это делает? Если я не ошибаюсь, кандзи - это символы между \u4e00и \u4dbf. Мне не нужно показывать канас , но показ их тоже не будет большой проблемой.
14 grep  unicode 

1
Как можно вводить символы Unicode в терминал KDE Konsole с рабочего стола Gnome?
Я использую Ubuntu. В 'gnome-terminal' я могу набирать кодовые точки Unicode, сначала набрав Ctrl-Shift-u, а затем шестнадцатеричное значение Codepoint, например. C-S-u 2468производит ⑨ konsole, мой предпочтительный терминал, не имеет этой функции CSu (гном) .. Есть ли какой-нибудь эквивалентный способ KDE сделать это в Konsole?

2
iconv Недопустимая последовательность ввода - почему?
При попытке преобразовать текстовый файл в его ASCII-эквивалент я получаю сообщение об ошибке iconv: illegal input sequence at position. Я использую команду iconv -f UTF-8 -t ascii//TRANSLIT file Оскорбительный персонаж есть æ. Сам текстовый файл присутствует здесь . Почему это говорит о недопустимой последовательности? Вводимый символ является правильным символом UTF-8 …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.