Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.

3
UnicodeDecodeError при перенаправлении в файл
Я запускаю этот фрагмент дважды, в терминале Ubuntu (кодировка установлена ​​на utf-8), один раз с, ./test.pyа затем с помощью ./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uni Без перенаправления выводит мусор. При перенаправлении я получаю UnicodeDecodeError. Может ли кто-нибудь объяснить, почему я получаю ошибку только во втором случае, а еще лучше …
100 python  unicode 

11
Как в Python отсортировать строки Unicode по алфавиту?
Python по умолчанию сортирует по байтовому значению, что означает, что é идет после z и других не менее забавных вещей. Как лучше всего сортировать по алфавиту в Python? Есть ли для этого библиотека? Я ничего не нашел. Предпочтительно сортировка должна иметь языковую поддержку, чтобы понимать, что åäö следует сортировать после …



7
Как декодировать escape-последовательности Unicode, такие как «\ u00ed», в правильные символы в кодировке UTF-8?
Есть ли в PHP функция, которая может декодировать escape-последовательности Unicode, такие как " \u00ed" to " í" и все другие подобные случаи? Я нашел здесь аналогичный вопрос, но, похоже, он не работает.



10
Как сравнить «похожие» символы Юникода?
Я попадаю в удивительную проблему. Я загрузил текстовый файл в свое приложение, и у меня есть логика, которая сравнивает значение, имеющее µ. И я понял, что даже если тексты одинаковые, значение сравнения ложное. Console.WriteLine("μ".Equals("µ")); // returns false Console.WriteLine("µ".Equals("µ")); // return true В следующей строке копируется символ µ. Однако это могут …

3
Как установить смайлики по юникоду в текстовом виде?
Привет, я бы хотел сделать следующее: ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); чтобы получить это в моем текстовом представлении: Так счастлив 😊 Как я могу реализовать getEmojiByUnicode(unicode)? Какого типа должна unicodeбыть переменная? (Строка, символ, целое число?) Обратите внимание, что …

13
Эквивалент Java JavaScript encodeURIComponent, который производит идентичный вывод?
Я экспериментировал с различными фрагментами кода Java, пытаясь придумать что-то, что будет кодировать строку, содержащую кавычки, пробелы и «экзотические» символы Unicode, и производить вывод, идентичный функции JavaScript encodeURIComponent . Моя тестовая строка на пытки: "А" Б ± " Если я введу следующий оператор JavaScript в Firebug: encodeURIComponent('"A" B ± "'); …

4
Что случилось с этими комбинированными символами Unicode и как их отфильтровать?
กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ Они недавно появились в разделах комментариев facebook. Как мы можем это очистить?


5
sqlite3.ProgrammingError: нельзя использовать 8-битные строки байтов, если вы не используете text_factory, которая может интерпретировать 8-битные строки байтов.
Используя SQLite3 в Python, я пытаюсь сохранить сжатую версию фрагмента HTML-кода UTF-8. Код выглядит так: ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid, zlib.compress(html))) В этот момент получите ошибку: sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless …
90 python  unicode  sqlite  zlib 

5
Отображение символов Юникода в HTML
Я хочу просто отобразить символы галочки (✔) и крестика (✘) на HTML-странице, но они отображаются либо как прямоугольник, либо как кружок ✠»- очевидно, что-то связано с кодировкой. Я установил метатег для отображения utf-8, но, очевидно, что-то мне не хватает. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> Изменить / Решение. Из комментариев, …
89 html  unicode 

6
Кодировка символов JSON - хорошо ли UTF-8 поддерживается браузерами или мне следует использовать числовые escape-последовательности?
Я пишу веб-сервис, который использует json для представления своих ресурсов, и я немного зациклился на том, как лучше всего закодировать json. Читая json rfc ( http://www.ietf.org/rfc/rfc4627.txt ), становится ясно, что предпочтительной кодировкой является utf-8. Но RFC также описывает механизм экранирования строки для указания символов. Я предполагаю, что это обычно используется …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.