Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.


7
Почему разрешено выполнение кода Java в комментариях с определенными символами Unicode?
Следующий код производит вывод "Hello World!" (нет, на самом деле, попробуйте). public static void main(String... args) { // The comment below is not a typo. // \u000d System.out.println("Hello World!"); } Причина этого заключается в том, что компилятор Java анализирует символ Unicode \u000dкак новую строку и преобразуется в: public static void …
1356 java  unicode  comments 

29
UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xa0' в позиции 20: порядковый номер не в диапазоне (128)
У меня проблемы с работой символов юникода из текста, полученного с разных веб-страниц (на разных сайтах). Я использую BeautifulSoup. Проблема в том, что ошибка не всегда воспроизводима; иногда он работает с некоторыми страницами, а иногда он бросает a UnicodeEncodeError. Я перепробовал практически все, что мог придумать, и все же я …

19
Какие символы можно использовать для треугольника вверх / вниз (стрелка без основы) для отображения в HTML?
Я ищу символ HTML или ASCII, представляющий собой треугольник, направленный вверх или вниз, чтобы я мог использовать его в качестве переключателя. Я нашел ↑ ( ↑) и ↓ ( ↓) - но у них узкий стебель. Я ищу только HTML-стрелку "голова".
1241 html  unicode  icons  ascii  symbols 


8
Что символ «b» делает перед строковым литералом?
Видимо, следующий допустимый синтаксис: my_string = b'The string' Я бы хотел знать: Что означает этот bсимвол перед строкой? Каковы последствия его использования? Каковы подходящие ситуации, чтобы использовать это? Я нашел связанный вопрос прямо здесь, на SO, но этот вопрос касается PHP, и в нем говорится, что bон используется, чтобы указать, …
833 python  string  unicode  binary 


12
std :: wstring VS std :: string
Я не могу понять разницу между std::stringи std::wstring. Я знаю, wstringподдерживает широкие символы, такие как символы Юникода. У меня есть следующие вопросы: Когда я должен использовать std::wstringболее std::string? Может ли std::stringсодержать весь набор символов ASCII, включая специальные символы? Является ли std::wstringподдерживаются компиляторами всех популярных C ++? Что такое « широкий …
742 c++  string  unicode  c++-faq  wstring 

2
Как работает текст Zalgo?
На этот вопрос есть ответы на Переполнение стека на русском : Как работает текст «Залго»? Я видел странно отформатированный текст под названием Zalgo, как показано ниже, на различных форумах. На это немного раздражает взгляд, но это действительно беспокоит меня, потому что это подрывает мое представление о том, каким должен быть …
694 html  unicode  zalgo 


7
Что именно делают строковые флаги «u» и «r», и что такое необработанные строковые литералы?
Задавая этот вопрос , я понял, что мало что знаю о необработанных строках. Для кого-то, претендующего на звание тренера Джанго, это отстой. Я знаю, что такое кодировка, и я знаю, что u''делает одна, поскольку я получаю Unicode. Но что именно делает r''? К какой строке это приводит? И прежде всего, …

15
Проблема кодирования изображений в Твиттере [закрыто]
В настоящее время этот вопрос не очень подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, вызовет дебаты, споры, опрос или расширенное обсуждение. Если вы считаете, что этот вопрос можно улучшить и, возможно, вновь открыть, обратитесь за …

7
Почему современный Perl по умолчанию избегает UTF-8?
Интересно, почему большинство современных решений, построенных с использованием Perl, не поддерживают UTF-8? по умолчанию . Я понимаю, что для основных скриптов Perl существует много проблем, которые могут сломать вещи. Но, с моей точки зрения, в 21 - м веке, большие новые проекты (или проекты с большой перспективой) должны сделать их …
557 perl  unicode  utf-8 

8
UnicodeDecodeError: кодек 'charmap' не может декодировать байт X в позиции Y: символ отображается на <undefined>
Я пытаюсь заставить программу на Python 3 выполнять некоторые манипуляции с текстовым файлом, заполненным информацией. Однако при попытке прочитать файл я получаю следующую ошибку: Traceback (most recent call last): File "SCRIPT LOCATION", line NUMBER, in &lt;module&gt; `text = file.read()` File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode `return codecs.charmap_decode(input,self.errors,decoding_table)[0]` UnicodeDecodeError: 'charmap' codec …

6
Почему символы эмодзи, такие как 👩‍👩‍👧‍👦, так странно воспринимаются в строках Swift?
Символ 👩‍👩‍👧‍👦 (семья с двумя женщинами, одной девочкой и одним мальчиком) кодируется так: U+1F469 WOMAN, ‍U+200D ZWJ, U+1F469 WOMAN, U+200D ZWJ, U+1F467 GIRL, U+200D ZWJ, U+1F466 BOY Так что это очень интересно закодировано; идеальная цель для юнит-теста. Однако Свифт, похоже, не знает, как с этим обращаться. Вот что я имею …
540 swift  string  unicode  emoji 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.