Вопросы с тегом «utf-8»

UTF-8 - это кодировка символов, которая описывает каждую кодовую точку Unicode с использованием последовательности байтов от одного до четырех байтов. Он обратно совместим с ASCII, но поддерживает представление всех кодовых точек Unicode.

9
Использование Javascript atob для декодирования base64 неправильно декодирует строки utf-8
Я использую window.atob()функцию Javascript для декодирования строки в кодировке base64 (в частности, содержимого в кодировке base64 из GitHub API). Проблема в том, что я возвращаю символы в кодировке ASCII (например, â¢вместо ™). Как я могу правильно обработать входящий поток в кодировке base64, чтобы он был декодирован как utf-8?

5
Как правильно кодировать символы Unicode в URL?
Я знаю нестандартную схему% uxxxx, но это не кажется разумным выбором, так как схема была отклонена W3C. Несколько интересных примеров: Сердечный персонаж. Если я введу это в свой браузер: http://www.google.com/search?q=♥ Затем скопируйте и вставьте его, я вижу этот URL http://www.google.com/search?q=%E2%99%A5 что заставляет думать, что Firefox (или Safari) делает это. urllib.quote_plus(x.encode("latin-1")) …

10
UnicodeDecodeError: кодек ascii не может декодировать байт 0xd1 в позиции 2: порядковый номер не в диапазоне (128)
Я пытаюсь работать с очень большим набором данных, в котором есть нестандартные символы. Мне нужно использовать юникод в соответствии со спецификациями работы, но я сбит с толку. (И вполне возможно, что все делаю неправильно.) Я открываю CSV, используя: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Затем я пытаюсь закодировать его …
107 python  django  utf-8 

16
UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1
У меня возникают проблемы с кодированием строки в UTF-8. Я пробовал множество вещей, в том числе с помощью string.encode('utf-8')и unicode(string), но получаю сообщение об ошибке: UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1: порядковый номер не в диапазоне (128) Это моя строка: (。・ω・。)ノ Я не понимаю, что …
106 python  unicode  utf-8 

2
Изменение кодировки вывода PowerShell по умолчанию на UTF-8
По умолчанию, когда вы перенаправляете вывод команды в файл или перенаправляете его во что-то другое в PowerShell, используется кодировка UTF-16, что бесполезно. Я хочу изменить его на UTF-8. Это можно сделать в каждом конкретном случае, заменив >foo.txtсинтаксис на, | out-file foo.txt -encoding utf8но неудобно повторять каждый раз. Постоянный способ настроить …

8
C # Преобразование строки из UTF-8 в ISO-8859-1 (Latin1) H
Я погуглил по этой теме и просмотрел все ответы, но до сих пор не понимаю. В основном мне нужно преобразовать строку UTF-8 в ISO-8859-1, и я делаю это, используя следующий код: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); Моя исходная строка Message = "ÄäÖöÕõÜü" Но, …
104 c#  .net  encoding  utf-8  iso-8859-1 

4
Как использовать греческие символы в ggplot2?
Мои категории нужно называть греческими буквами. Я использую ggplot2, и он прекрасно работает с данными. К сожалению, я не могу понять, как разместить эти греческие символы на оси x (в отметках), а также сделать так, чтобы они появлялись в легенде. Есть ли способ это сделать? ОБНОВЛЕНИЕ: я просмотрел ссылку , …
103 r  graphics  unicode  utf-8  ggplot2 


6
Использование StringWriter для сериализации XML
В настоящее время я ищу простой способ сериализации объектов (в C # 3). Я погуглил несколько примеров и придумал что-то вроде: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 ); xs.Serialize ( xmlTextWriter, …

7
Как декодировать escape-последовательности Unicode, такие как «\ u00ed», в правильные символы в кодировке UTF-8?
Есть ли в PHP функция, которая может декодировать escape-последовательности Unicode, такие как " \u00ed" to " í" и все другие подобные случаи? Я нашел здесь аналогичный вопрос, но, похоже, он не работает.

10
Сколько символов может кодировать UTF-8?
Если UTF-8 имеет 8 бит, не означает ли это, что может быть не более 256 различных символов? Первые 128 кодовых точек такие же, как в ASCII. Но в нем говорится, что UTF-8 может поддерживать до миллиона символов? Как это работает?

3
Чтение InputStream как UTF-8
Я пытаюсь прочитать text/plainфайл через Интернет построчно. Код, который у меня есть прямо сейчас: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line : lines) { out.println("> " + …

5
Пример недопустимой строки utf8?
Я тестирую, как часть моего кода обрабатывает неверные данные, и мне нужно несколько серий байтов с недопустимым UTF-8. Можете ли вы опубликовать некоторые, а в идеале, объяснение, почему они плохие / где вы их взяли?

11
Элегантный способ поиска файлов UTF-8 с помощью спецификации?
В целях отладки мне нужно рекурсивно искать в каталоге все файлы, которые начинаются с отметки порядка байтов (BOM) UTF-8. Мое текущее решение - это простой сценарий оболочки: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ] then echo "found BOM in: …
94 php  utf-8  shell  text-editor 

9
Чтение CSV-файла UTF8 с помощью Python
Я пытаюсь прочитать CSV-файл с акцентированными символами с помощью Python (только французские и / или испанские символы). Основываясь на документации Python 2.5 для csvreader ( http://docs.python.org/library/csv.html ), я придумал следующий код для чтения файла CSV, поскольку csvreader поддерживает только ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.