Вопросы с тегом «utf-8»

UTF-8 - это кодировка символов, которая описывает каждую кодовую точку Unicode с использованием последовательности байтов от одного до четырех байтов. Он обратно совместим с ASCII, но поддерживает представление всех кодовых точек Unicode.

14
Юникод (UTF-8) чтение и запись в файлы на Python
У меня какой-то мозговой сбой в понимании чтения и записи текста в файл (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8 = ss.encode('utf8') repr(ss), repr(ss8) («u'Capit \ xe1n», «Capit \ xc3 \ xa1n») print ss, ss8 print >> open('f1','w'), ss8 >>> file('f1').read() 'Capit\xc3\xa1n\n' …
331 python  unicode  utf-8  io 

24
Определите кодировку и сделайте все в UTF-8
Я читаю много текстов из различных RSS-каналов и вставляю их в свою базу данных. Конечно, в каналах используется несколько разных кодировок символов, например, UTF-8 и ISO 8859-1. К сожалению, иногда возникают проблемы с кодировкой текстов. Пример: «Ss» в «Fußball» в моей базе данных должно выглядеть так: «ÂŸ». Если это «В», …

5
UTF-8: генерал? Бен? Unicode?
Я пытаюсь выяснить, какую сортировку я должен использовать для различных типов данных. 100% содержимого, которое я буду хранить, отправлено пользователем. Насколько я понимаю, я должен использовать UTF-8 General CI (без учета регистра) вместо UTF-8 Binary. Однако я не могу найти четкого различия между UTF-8 General CI и UTF-8 Unicode CI. …
279 mysql  utf-8  collation 


16
Как использовать UTF-8 в свойствах ресурса с ResourceBundle
Мне нужно использовать UTF-8 в свойствах моего ресурса, используя Java ResourceBundle. Когда я ввожу текст прямо в файл свойств, он отображается как mojibake. Мое приложение работает на Google App Engine. Кто-нибудь может дать мне пример? Я не могу получить эту работу.


2
URL декодировать UTF-8 в Python
Я провел много времени, насколько я новичок в Python. Как я мог когда-либо расшифровать такой URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 к этому в Python 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) возвращает что-то очень некрасивое. Все еще нет решения, любая помощь приветствуется.

11
UTF-8 байт [] в строку
Давайте предположим, что я только что использовал a BufferedInputStreamдля чтения байтов текстового файла в кодировке UTF-8 в байтовый массив. Я знаю, что могу использовать следующую процедуру для преобразования байтов в строку, но есть ли более эффективный / более умный способ сделать это, чем просто перебирать байты и конвертировать каждый из …
243 java  utf-8 

17
«Неверное строковое значение» при попытке вставить UTF-8 в MySQL через JDBC?
Вот как устанавливается мое соединение: Connection conn = DriverManager.getConnection(url + dbName + "?useUnicode=true&characterEncoding=utf-8", userName, password); И я получаю следующую ошибку при попытке добавить строку в таблицу: Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...' for column 'content' at row 1 Я вставляю тысячи записей, и я всегда получаю эту ошибку, когда текст содержит \ …
228 mysql  jdbc  utf-8  utf8mb4 

16
Мне действительно нужно кодировать '&' как '& amp;'?
Я использую &символ ' ' с HTML5 и UTF-8 на своем сайте <title>. Google показывает амперсанд отлично на его выдаче, как и все браузеры в их названиях. http://validator.w3.org дает мне это: & не начал ссылку на символ. (и, вероятно, следовало бы избежать как &.) Мне действительно нужно сделать &? Я …

4
Запись в файл UTF-8 на Python
Я действительно запутался с codecs.open function. Когда я делаю: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Это дает мне ошибку UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xef в позиции 0: порядковый номер не в диапазоне (128) Если я сделаю: file = open("temp", "w") file.write(codecs.BOM_UTF8) file.close() Работает нормально. Вопрос в …

8
Проблемы с кодировкой HTML - вместо символа & nbsp; появляется символ «Â»
У меня есть устаревшее приложение, которое только начинает плохо себя вести, по какой-то причине я не уверен. Он генерирует кучу HTML, который ActivePDF превращает в отчеты PDF. Процесс работает так: Извлеките шаблон HTML из БД с токенами в нем для замены (например, "~ CompanyName ~", "~ CustomerName ~" и т. …

13
PHP DOMDocument loadHTML неправильно кодирует UTF-8
Я пытаюсь разобрать некоторый HTML с помощью DOMDocument, но когда я это делаю, я внезапно теряю свою кодировку (по крайней мере, так мне кажется). $profile = "<div><p>various japanese characters</p></div>"; $dom = new DOMDocument(); $dom->loadHTML($profile); $divs = $dom->getElementsByTagName('div'); foreach ($divs as $div) { echo $dom->saveHTML($div); } Результатом этого кода является то, …

9
Как преобразовать строку в UTF-8 в Python
У меня есть браузер, который отправляет символы utf-8 на мой сервер Python, но когда я получаю его из строки запроса, Python возвращает кодировку ASCII. Как я могу преобразовать простую строку в UTF-8? ПРИМЕЧАНИЕ. Строка, передаваемая из Интернета, уже закодирована в UTF-8, я просто хочу, чтобы Python рассматривал ее как UTF-8, …

30
Как я могу вывести UTF-8 CSV на PHP, который Excel будет читать правильно?
У меня есть очень простая вещь, которая просто выводит некоторые вещи в формате CSV, но это должен быть UTF-8. Я открываю этот файл в TextEdit или TextMate или Dreamweaver, и он правильно отображает символы UTF-8, но если я открываю его в Excel, он делает это глупо - вместо этого. Вот …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.