Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.

6
Проблема с кодировкой Java FileReader
Я попытался использовать java.io.FileReader для чтения некоторых текстовых файлов и преобразования их в строку, но обнаружил, что результат неверно закодирован и вообще не читается. Вот моя среда: Windows 2003, кодировка ОС: CP1252 Java 5.0 Мои файлы имеют кодировку UTF-8 или CP1252, и некоторые из них (файлы с кодировкой UTF-8) могут …
130 java  file  unicode  encoding 

7
Что такое нормализованный UTF-8?
Проект ICU (который теперь также имеет библиотеку PHP ) содержит классы, необходимые для нормализации строк UTF-8, чтобы упростить сравнение значений при поиске. Однако я пытаюсь понять, что это значит для приложений. Например, в каких случаях мне нужно «Каноническая эквивалентность» вместо «эквивалентности совместимости» или наоборот?

12
Преобразование символов и букв с ударением в английский алфавит
Проблема в том, что, как вы знаете, в диаграмме Unicode есть тысячи символов, и я хочу преобразовать все похожие символы в буквы английского алфавита. Например, вот несколько преобразований: ҥ->H Ѷ->V Ȳ->Y Ǭ->O Ƈ->C tђє Ŧค๓เℓy --> the Family ... и я увидел, что существует более 20 вариантов буквы А / …


8
Какой код символа HTML 8203?
Что означает код символа (HTML) ​? Я нашел его в одном из моих скриптов jQuery и задумался, что это такое ... Спасибо. Редактировать: Вот сценарий, в котором он был (добавлен в конец, нашел в Firebug) <script src="http://code.jquery.com/jquery-latest.js" type="text/javascript"></script> <script type="text/javascript"> var $jnyh = jQuery.noConflict(); $jnyh(function() { $jnyh("#title-nyh").click(function() { $jnyh(".show-hide-nyh").slideDown("slow"); }, …

3
Эквиваленты Unicode для \ w и \ b в регулярных выражениях Java?
Многие современные реализации регулярных выражений интерпретируют \wсокращение класса символов как «любую букву, цифру или соединительную пунктуацию» (обычно: подчеркивание). Таким образом, регулярное выражение , как \w+спички слова , как hello, élève, GOÄ_432или gefräßig. К сожалению, в Java нет. В Java \wограничено [A-Za-z0-9_]. Это, среди прочего, затрудняет сопоставление слов, подобных упомянутым выше. …

10
Как предотвратить отображение символов Юникода как эмодзи в HTML из JavaScript?
Я нахожу Unicode для специальных символов из поиска FileFormat.Info . Некоторые символы отображаются как классические черно-белые глифы, например ⚠ (предупреждающий знак \u26A0или ⚠). Это предпочтительнее, поскольку я могу применять к ним стили CSS (например, цвет). Другие визуализируются как новые мультяшные эмодзи, например ⌛ (песочные часы \u231Bили ⌛). Это нежелательно, так …
120 javascript  html  css  unicode  emoji 

7
Python - кодек ascii не может декодировать байт
Я действительно смущен. Я пытался кодировать но ошибка сказала can't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128) Я знаю, как избежать ошибки с префиксом «u» в строке. Мне просто …

4
CSS: как добавить пробел перед содержимым элемента?
Ни один из следующих кодов не работает: p:before { content: " "; } p:before { content: " "; } Как добавить пробел перед содержимым элемента? Примечание. Мне нужно раскрасить левую границу и левое поле для семантического использования и использовать пространство как бесцветное поле. :)

13
Создание символа Unicode из его номера
Я хочу отобразить символ Unicode в Java. Если я сделаю это, все будет нормально: String symbol = "\u2202"; символ равен «∂». Это то, что я хочу. Проблема в том, что я знаю номер Unicode, и мне нужно создать из него символ Unicode. Я попробовал (для меня) очевидное: int c = …

6
Как я могу вывести UTF-8 из Perl?
Я пытаюсь написать сценарий Perl, используя прагму «utf8», и получаю неожиданные результаты. Я использую Mac OS X 10.5 (Leopard) и редактирую с помощью TextMate. Все мои настройки и для моего редактора, и для операционной системы по умолчанию настроены на запись файлов в формате utf-8. Однако, когда я ввожу следующее в …
110 perl  unicode  utf-8 

3
Как работает «кодировка переменной ширины» UTF-8?
В стандарте unicode достаточно кодовых точек, поэтому вам нужно 4 байта для их хранения. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства, используя так называемое «кодирование переменной ширины». Фактически, ему удается представить первые 127 символов US-ASCII всего одним байтом, который …

3
Какие символы Unicode, отличные от BMP, наиболее часто используются на практике? [закрыто]
Закрыто . Этот вопрос должен быть более конкретным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он фокусировался только на одной проблеме, отредактировав этот пост . Закрыт 6 лет назад . Уточните этот вопрос По вашему опыту, какие символы Unicode, кодовые точки, диапазоны …

5
Как правильно кодировать символы Unicode в URL?
Я знаю нестандартную схему% uxxxx, но это не кажется разумным выбором, так как схема была отклонена W3C. Несколько интересных примеров: Сердечный персонаж. Если я введу это в свой браузер: http://www.google.com/search?q=♥ Затем скопируйте и вставьте его, я вижу этот URL http://www.google.com/search?q=%E2%99%A5 что заставляет думать, что Firefox (или Safari) делает это. urllib.quote_plus(x.encode("latin-1")) …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.