Вопросы с тегом «character-encoding»

Кодировка символов относится к способу представления символов в виде последовательности байтов. Кодировка символов для Интернета определяется в стандарте кодирования.

17
Есть ли перевернутый каретный персонаж?
Я должен поддерживать большое количество классических ASP-страниц, многие из которых имеют табличные данные без каких-либо возможностей сортировки. Какой бы порядок не использовал исходный разработчик в запросе к базе данных, это то, с чем вы застряли. Я хочу использовать некоторые базовые функции сортировки для нескольких страниц, и я делаю все это …

13
Как преобразовать строки в и из байтовых массивов UTF8 в Java
В Java у меня есть String, и я хочу закодировать его как байтовый массив (в UTF8 или в какой-либо другой кодировке). С другой стороны, у меня есть байтовый массив (в некоторой известной кодировке), и я хочу преобразовать его в строку Java. Как мне сделать эти преобразования?

8
Записывает текст Unicode в текстовый файл?
Я вытаскиваю данные из документа Google, обрабатываю их и записываю в файл (который в итоге вставлю на страницу Wordpress). У него есть не-ASCII символы. Как я могу безопасно преобразовать их в символы, которые можно использовать в исходном коде HTML? В настоящее время я конвертирую все в Unicode по пути, объединяю …

18
Как вы повторяете 4-значный символ Unicode в Bash?
Я хотел бы добавить череп и скрещенные кости Юникода в мою подсказку оболочки (в частности, «ЧЕРЕП И КРЕСТЫ» (U + 2620)), но я не могу понять магическое заклинание, которое заставило бы эхо выплюнуть его или любое другое, 4-значный Unicode символ. Двузначные легко. Например, echo -e "\ x55",. В дополнение к …


10
«Для строки в…» приводит к UnicodeDecodeError: кодек «utf-8» не может декодировать байт
Вот мой код, for line in open('u.item'): #read each line всякий раз, когда я запускаю этот код, он выдает следующую ошибку: UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 2892: invalid continuation byte Я попытался решить эту проблему и добавить дополнительный параметр в open (), код выглядит так; for …

10
Что такое вертикальная вкладка?
Каково было историческое использование символа вертикальной табуляции ( \vна языке C, ASCII 11)? У него когда-нибудь была клавиша на клавиатуре? Как кто-то это сгенерировал? Есть ли еще какой-либо язык или система, которая используется сегодня, когда символ вертикальной табуляции делает что-то интересное и полезное?

6
Почему имена кодировок не являются константами?
Проблемы с кодировками сами по себе сбивают с толку и усложняют, но, кроме того, вы должны помнить точные имена ваших кодировок. Это "utf8"? Или "utf-8"? Или может быть "UTF-8"? При поиске примеров кода в интернете вы увидите все вышеперечисленное. Почему бы просто не сделать их именованными константами и использовать Charset.UTF8?

16
Мне действительно нужно кодировать '&' как '& amp;'?
Я использую &символ ' ' с HTML5 и UTF-8 на своем сайте <title>. Google показывает амперсанд отлично на его выдаче, как и все браузеры в их названиях. http://validator.w3.org дает мне это: & не начал ссылку на символ. (и, вероятно, следовало бы избежать как &.) Мне действительно нужно сделать &? Я …

13
PHP DOMDocument loadHTML неправильно кодирует UTF-8
Я пытаюсь разобрать некоторый HTML с помощью DOMDocument, но когда я это делаю, я внезапно теряю свою кодировку (по крайней мере, так мне кажется). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Результатом этого кода является то, …

6
В чем разница между кодированием / декодированием?
Я никогда не был уверен, что понимаю разницу между декодированием str / unicode и кодированием. Я знаю, что str().decode()для случая, когда у вас есть строка байтов, которая, как вы знаете, имеет определенную кодировку символов, при условии, что это имя кодировки вернет строку Unicode. Я знаю, что unicode().encode()преобразует символы Unicode в …

11
Конвертировать Unicode в ASCII без ошибок в Python
Мой код просто очищает веб-страницу, а затем преобразует ее в Unicode. html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) Но я получаю UnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal …

4
Зачем указывать @charset «UTF-8»; в вашем файле CSS?
Я видел эту инструкцию как самую первую строку из множества CSS-файлов, которые были переданы мне: @charset "UTF-8"; Что он делает, и нужно ли это правило? Кроме того, если я включу этот метатег в свой элемент head, исключит ли это необходимость его присутствия в моих файлах CSS? <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

11
В чем разница между кодировкой и кодировкой?
Я запутался в кодировке текста и кодировке. По многим причинам, я должен изучать не-Unicode, не-UTF8 материал в моей предстоящей работе. Я нахожу слово «charset» в заголовках писем, как в «ISO-2022-JP», но в текстовых редакторах такой кодировки нет. (Я осмотрел разные текстовые редакторы.) В чем разница между кодировкой текста и кодировкой? …

11
PHP: конвертировать любую строку в UTF-8, не зная исходного набора символов, или хотя бы попытаться
У меня есть приложение, которое работает с клиентами со всего мира, и, естественно, я хочу, чтобы все, что входит в мои базы данных, было в кодировке UTF-8. Основная проблема для меня заключается в том, что я не знаю, какой будет кодировка источника какой-либо строки - это может быть из текстового …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.