Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.

12
Представление структуры каталогов и файлов в синтаксисе уценки
Я хочу описать структуру каталогов и файлов в некоторых моих сообщениях в блоге Jekyll. Предоставляет ли Markdown удобный способ вывода такой вещи? Например, по этой ссылке на веб-сайте Jekyll вы можете видеть, что структура каталогов и файлов выводится на страницу очень аккуратно: . ├── _config.yml ├── _drafts │ ├── begin-with-the-crazy-ideas.textile …
216 unicode  markdown  jekyll 

6
Python __str__ против __unicode__
Есть ли соглашение Python, когда вы должны реализовать __str__()против __unicode__(). Я видел, как классы переопределяют __unicode__()чаще, чем, __str__()но они не выглядят согласованными. Существуют ли конкретные правила, когда лучше реализовать одно против другого? Это необходимо / хорошая практика для реализации обоих?

16
Как проверить, находится ли строка в Python в ASCII?
Я хочу проверить, есть ли строка в ASCII или нет. Я знаю ord(), однако, когда я пытаюсь ord('é'), у меня есть TypeError: ord() expected a character, but string of length 2 found. Я понял, что это вызвано тем, как я собирал Python (как объяснено в ord()документации ). Есть ли другой …
212 python  string  unicode  ascii 

7
Что такое «соединительные символы» в идентификаторах Java?
Я читаю для SCJP, и у меня есть вопрос относительно этой строки: Идентификаторы должны начинаться с буквы, символа валюты ($) или соединительного символа, такого как подчеркивание (_). Идентификаторы не могут начинаться с цифры! В нем говорится, что допустимое имя идентификатора может начинаться с соединительного символа, такого как подчеркивание. Я думал, …
208 java  unicode  identifier  scjp 

16
Как конвертировать wstring в строку?
Вопрос в том, как преобразовать строку в строку? У меня есть следующий пример: #include <string> #include <iostream> int main() { std::wstring ws = L"Hello"; std::string s( ws.begin(), ws.end() ); //std::cout <<"std::string = "<<s<<std::endl; std::wcout<<"std::wstring = "<<ws<<std::endl; std::cout <<"std::string = "<<s<<std::endl; } вывод с закомментированной строкой: std::string = Hello std::wstring = …
204 c++  unicode  stl  wstring 

9
Как преобразовать строку в UTF-8 в Python
У меня есть браузер, который отправляет символы utf-8 на мой сервер Python, но когда я получаю его из строки запроса, Python возвращает кодировку ASCII. Как я могу преобразовать простую строку в UTF-8? ПРИМЕЧАНИЕ. Строка, передаваемая из Интернета, уже закодирована в UTF-8, я просто хочу, чтобы Python рассматривал ее как UTF-8, …

5
Есть ли символ символа Unicode для обозначения «Поиск» [закрыто]
Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 4 года назад . Улучшить этот вопрос Юникод имеет миллион иконоподобных глифов, но их очень сложно найти. …

5
Насколько хорошо Юникод поддерживается в C ++ 11?
Я читал и слышал, что C ++ 11 поддерживает Unicode. Несколько вопросов по этому поводу: Насколько хорошо стандартная библиотека C ++ поддерживает Unicode? Делает std::stringто, что должен? Как мне это использовать? Где потенциальные проблемы?
183 c++  unicode  c++11 

6
В чем разница между кодированием / декодированием?
Я никогда не был уверен, что понимаю разницу между декодированием str / unicode и кодированием. Я знаю, что str().decode()для случая, когда у вас есть строка байтов, которая, как вы знаете, имеет определенную кодировку символов, при условии, что это имя кодировки вернет строку Unicode. Я знаю, что unicode().encode()преобразует символы Unicode в …

11
Конвертировать Unicode в ASCII без ошибок в Python
Мой код просто очищает веб-страницу, а затем преобразует ее в Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Но я получаю UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal …


9
(grep) Regex для соответствия не-ASCII символам?
В Linux у меня есть каталог с большим количеством файлов. Некоторые из них имеют символы не ASCII, но все они действительны в формате UTF-8 . В одной программе есть ошибка, которая не позволяет ей работать с именами, отличными от ASCII, и я должен выяснить, сколько из них затронуто. Я собирался …
169 regex  unicode  grep  ascii 

6
u '\ ufeff' в строке Python
Я получаю сообщение об ошибке со следующей скороговоркой: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Не уверен, что это u'\ufeff'такое, оно появляется, когда я просматриваю веб-страницы. Как я могу исправить ситуацию? .replace()Строковый метод не работает на нем.
169 python  unicode  utf-8 


9
Конкретное регулярное выражение Javascript для акцентированных символов (диакритические знаки)
Я посмотрел на переполнение стека ( замена символов ... например , как JavaScript не соответствует стандарту Unicode относительно RegExp и т. Д.) И не нашел конкретного ответа на вопрос: How can JavaScript match for accented characters (those with diacritical marks)? Я заставляю поле в пользовательском интерфейсе соответствовать формату: last_name, first_name …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.