Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.

8
Символ Unicode в строке PHP
Этот вопрос выглядит смущающе простым, но я не смог найти ответ. Что такое PHP эквивалент следующей строки кода C #? string str = "\u1000"; В этом примере создается строка с одним символом Unicode, чье «числовое значение Unicode» равно 1000 в шестнадцатеричном формате (4096 в десятичном виде). То есть в PHP …
164 php  unicode 

2
В чем разница между символом, кодовой точкой, глифом и графемой?
От попыток разобраться в тонкостях современного Unicode у меня заболела голова. В частности, различие между кодовыми точками, символами, глифами и графемами - концепциями, которые в простейшем случае, при работе с английским текстом с использованием символов ASCII, все имеют однозначное отношение друг к другу, - вызывает у меня проблемы. Наблюдая за …

9
MySQL «неправильное значение строки» ошибка при сохранении строки Unicode в Django
При попытке сохранить first_name, last_name в модель Django auth_user я получил странное сообщение об ошибке. Неудачные примеры user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column 'last_name' at row 104 user.first_name = u'Валерий' user.last_name = u'Богданов' user.save() >>> Incorrect string …
158 python  mysql  django  unicode  utf-8 

3
Python: использование .format () в строке с экранированием Unicode
Я использую Python 2.6.5. Мой код требует использования знака «больше или равно». Здесь это идет: >>> s = u'\u2265' >>> print s >>> ≥ >>> print "{0}".format(s) Traceback (most recent call last): File "<input>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'\u2265' in position 0: ordinal not …

7
Что такое «суррогатная пара» в Java?
Я читал документацию для StringBuffer, в частности, метода reverse () . Эта документация упоминает что-то о суррогатных парах . Что такое суррогатная пара в этом контексте? А что такое низкие и высокие суррогаты?

13
Python, Unicode и консоль Windows
На этот вопрос есть ответы на Stack Overflow на русском : Как из Python вывести на Windows-консоль строку в Юникоде? Когда я пытаюсь напечатать строку Unicode в консоли Windows, я получаю сообщение UnicodeEncodeError: 'charmap' codec can't encode character ....об ошибке. Я предполагаю, что это связано с тем, что консоль Windows …
149 python  unicode 

10
Строка Python печатается как [u'String ']
На этот вопрос есть ответы на Stack Overflow in English : по кодировкам utf-8 выдает результат по-разному при печати строк по отдельности и списка целиком Конечно, это будет легко, но меня это действительно беспокоит. У меня есть сценарий, который читает веб-страницу и использует Beautiful Soup для ее анализа. Из супа …
148 python  unicode  ascii 


8
Почему длина этой строки превышает количество символов в ней?
Этот код: string a = "abc"; string b = "A𠈓C"; Console.WriteLine("Length a = {0}", a.Length); Console.WriteLine("Length b = {0}", b.Length); выходы: Length a = 3 Length b = 4 Зачем? Единственное, что я могу себе представить, это то, что китайский символ имеет длину 2 байта и что .Lengthметод возвращает количество …

8
Могу ли я заставить git распознавать файл UTF-16 как текст?
Я отслеживаю файл виртуальной машины Virtual PC (* .vmc) в git, и после внесения изменений git определил файл как двоичный и не стал бы различать его для меня. Я обнаружил, что файл был закодирован в UTF-16. Можно ли научить git распознавать, что это текстовый файл, и обрабатывать его соответствующим образом? …

6
Почему Python печатает символы юникода, если кодировка по умолчанию - ASCII?
Из оболочки Python 2.6: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> Я ожидал, что после оператора печати будет какая-то тарабарщина или ошибка, поскольку символ «é» не является частью ASCII, и я не указал кодировку. Думаю, я не понимаю, что означает кодировка ASCII по умолчанию. РЕДАКТИРОВАТЬ …

5
Разница между UTF-8 и UTF-16?
Разница между UTF-8 и UTF-16? Зачем нам это нужно? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
137 java  unicode  utf-8  utf-16  utf 

4
NameError: глобальное имя 'unicode' не определено - в Python 3
Я пытаюсь использовать пакет Python под названием bidi. В модуле этого пакета (algorithm.py) есть несколько строк, которые выдают мне ошибку, хотя это часть пакета. Вот строки: # utf-8 ? we need unicode if isinstance(unicode_or_str, unicode): text = unicode_or_str decoded = False else: text = unicode_or_str.decode(encoding) decoded = True и вот …

7
Юникод символы в URL
В 2010 году вы бы обслуживали URL-адреса, содержащие символы UTF-8, на большом веб-портале? Символы Юникода запрещены согласно RFC на URL (см. Здесь ). Они должны быть закодированы в процентах, чтобы соответствовать стандартам. Тем не менее, моя главная мысль - это обслуживание некодированных символов с единственной целью иметь красивые URL-адреса, так …
135 html  url  unicode  utf-8 

3
Вставить символ Юникода в JavaScript
Мне нужно вставить Омегу (Ω) на мою HTML-страницу. Для этого я использую его экранированный код HTML, поэтому я могу написать Ωи получить Ω. Это все прекрасно, когда я помещаю это в элемент HTML; однако, когда я пытаюсь поместить его в свой JS, например var Omega = Ω, он анализирует этот …
134 javascript  html  unicode 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.