Вопросы с тегом «utf-8»

UTF-8 - это кодировка символов, которая описывает каждую кодовую точку Unicode с использованием последовательности байтов от одного до четырех байтов. Он обратно совместим с ASCII, но поддерживает представление всех кодовых точек Unicode.

7
Юникод символы в URL
В 2010 году вы бы обслуживали URL-адреса, содержащие символы UTF-8, на большом веб-портале? Символы Юникода запрещены согласно RFC на URL (см. Здесь ). Они должны быть закодированы в процентах, чтобы соответствовать стандартам. Тем не менее, моя главная мысль - это обслуживание некодированных символов с единственной целью иметь красивые URL-адреса, так …
135 html  url  unicode  utf-8 

11
"Â € ™" отображается на странице вместо "" "
’отображается на моей странице вместо '. У меня Content-Typeустановлен UTF-8как в моем <head>теге, так и в моих заголовках HTTP: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> Кроме того, мой браузер настроен на Unicode (UTF-8): Так в чем проблема и как ее исправить?
133 encoding  utf-8  mojibake 



5
Зачем объявлять Unicode по строке в Python?
Я все еще изучаю питон и сомневаюсь: В python 2.6.x я обычно объявляю кодировку в заголовке файла следующим образом (как в PEP 0263 ) # -*- coding: utf-8 -*- После этого мои строки пишутся как обычно: a = "A normal string without declared Unicode" Но каждый раз, когда я вижу …
122 python  encoding  utf-8 

11
Outlook автоматически очищает мои разрывы строк и портит формат электронной почты
Я отправляю электронное письмо, используя структуру dotnet. Вот шаблон, который я использую для создания сообщения: Date of Hire: %HireDate% Annual Salary: %AnnualIncome% Reason for Request: %ReasonForRequest% Name of Voluntary Employee: %FirstName% %LastName% Total Coverage Applied For: %EECoverageAmount% Guaranteed Coverage Portion: %GICoveragePortion% Amount Subject to Medical Evident: %GIOverage% Когда сообщение получено …
119 .net  utf-8  outlook  smtp 



4
Сериализация объекта как UTF-8 XML в .NET
Правильная утилизация объекта удалена для краткости, но я шокирован, если это самый простой способ кодировать объект как UTF-8 в памяти. Должен быть способ попроще, не так ли? var serializer = new XmlSerializer(typeof(SomeSerializableObject)); var memoryStream = new MemoryStream(); var streamWriter = new StreamWriter(memoryStream, System.Text.Encoding.UTF8); serializer.Serialize(streamWriter, entry); memoryStream.Seek(0, SeekOrigin.Begin); var streamReader = …

12
Предупреждение "несопоставимый символ для кодировки" в Java
В настоящее время я работаю над Java-проектом, который при компиляции выдает следующее предупреждение: /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; Я не уверен, как SO отобразит символ до даты, но это должен быть символ авторского права и отображаться в …
113 java  encoding  utf-8  ascii 

8
УСТАНОВИТЬ ИМЕНА utf8 в MySQL?
Я часто вижу что-то подобное в сценариях PHP, использующих MySQL. query("SET NAMES utf8"); Мне никогда не приходилось делать это ни для одного проекта, поэтому у меня есть пара основных вопросов по этому поводу. Это что-то, что делается только с PDO? Если это не специфическая вещь для PDO, то какова цель …
110 php  mysql  utf-8 

6
Как я могу вывести UTF-8 из Perl?
Я пытаюсь написать сценарий Perl, используя прагму «utf8», и получаю неожиданные результаты. Я использую Mac OS X 10.5 (Leopard) и редактирую с помощью TextMate. Все мои настройки и для моего редактора, и для операционной системы по умолчанию настроены на запись файлов в формате utf-8. Однако, когда я ввожу следующее в …
110 perl  unicode  utf-8 

3
Как работает «кодировка переменной ширины» UTF-8?
В стандарте unicode достаточно кодовых точек, поэтому вам нужно 4 байта для их хранения. Вот что делает кодировка UTF-32. Тем не менее, кодировка UTF-8 каким-то образом сжимает их в гораздо меньшие пространства, используя так называемое «кодирование переменной ширины». Фактически, ему удается представить первые 127 символов US-ASCII всего одним байтом, который …

11
ruby 1.9: неверная последовательность байтов в UTF-8
Я пишу краулер на Ruby (1.9), который потребляет много HTML с множества случайных сайтов. При попытке извлечь ссылки я решил просто использовать .scan(/href="(.*?)"/i)вместо nokogiri / hpricot (значительное ускорение). Проблема в том, что теперь я получаю много " invalid byte sequence in UTF-8" ошибок. Насколько я понял, в net/httpбиблиотеке нет каких-либо …
109 ruby  encoding  utf-8 

8
Метка порядка байтов портит чтение файлов в Java
Я пытаюсь читать файлы CSV с помощью Java. Некоторые файлы могут иметь отметку порядка байтов в начале, но не все. Когда он присутствует, порядок байтов читается вместе с остальной частью первой строки, что вызывает проблемы со сравнением строк. Есть ли простой способ пропустить отметку порядка байтов, когда она присутствует?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.