программирование utf-8

9

Использование Javascript atob для декодирования base64 неправильно декодирует строки utf-8

Я использую window.atob()функцию Javascript для декодирования строки в кодировке base64 (в частности, содержимого в кодировке base64 из GitHub API). Проблема в том, что я возвращаю символы в кодировке ASCII (например, â¢вместо ™). Как я могу правильно обработать входящий поток в кодировке base64, чтобы он был декодирован как utf-8?

108 javascript encoding utf-8

5

Как правильно кодировать символы Unicode в URL?

Я знаю нестандартную схему% uxxxx, но это не кажется разумным выбором, так как схема была отклонена W3C. Несколько интересных примеров: Сердечный персонаж. Если я введу это в свой браузер: http://www.google.com/search?q=♥ Затем скопируйте и вставьте его, я вижу этот URL http://www.google.com/search?q=%E2%99%A5 что заставляет думать, что Firefox (или Safari) делает это. urllib.quote_plus(x.encode("latin-1")) …

107 unicode utf-8 character-encoding urlencode web-standards

10

UnicodeDecodeError: кодек ascii не может декодировать байт 0xd1 в позиции 2: порядковый номер не в диапазоне (128)

Я пытаюсь работать с очень большим набором данных, в котором есть нестандартные символы. Мне нужно использовать юникод в соответствии со спецификациями работы, но я сбит с толку. (И вполне возможно, что все делаю неправильно.) Я открываю CSV, используя: 15 ncesReader = csv.reader(open('geocoded_output.csv', 'rb'), delimiter='\t', quotechar='"') Затем я пытаюсь закодировать его …

107 python django utf-8

16

UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1

У меня возникают проблемы с кодированием строки в UTF-8. Я пробовал множество вещей, в том числе с помощью string.encode('utf-8')и unicode(string), но получаю сообщение об ошибке: UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1: порядковый номер не в диапазоне (128) Это моя строка: (｡･ω･｡)ﾉ Я не понимаю, что …

106 python unicode utf-8

2

Изменение кодировки вывода PowerShell по умолчанию на UTF-8

По умолчанию, когда вы перенаправляете вывод команды в файл или перенаправляете его во что-то другое в PowerShell, используется кодировка UTF-16, что бесполезно. Я хочу изменить его на UTF-8. Это можно сделать в каждом конкретном случае, заменив >foo.txtсинтаксис на, | out-file foo.txt -encoding utf8но неудобно повторять каждый раз. Постоянный способ настроить …

105 powershell utf-8 character-encoding

8

C # Преобразование строки из UTF-8 в ISO-8859-1 (Latin1) H

Я погуглил по этой теме и просмотрел все ответы, но до сих пор не понимаю. В основном мне нужно преобразовать строку UTF-8 в ISO-8859-1, и я делаю это, используя следующий код: Encoding iso = Encoding.GetEncoding("ISO-8859-1"); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); Моя исходная строка Message = "ÄäÖöÕõÜü" Но, …

104 c# .net encoding utf-8 iso-8859-1

4

Как использовать греческие символы в ggplot2?

Мои категории нужно называть греческими буквами. Я использую ggplot2, и он прекрасно работает с данными. К сожалению, я не могу понять, как разместить эти греческие символы на оси x (в отметках), а также сделать так, чтобы они появлялись в легенде. Есть ли способ это сделать? ОБНОВЛЕНИЕ: я просмотрел ссылку , …

103 r graphics unicode utf-8 ggplot2

14

Как заставить MySQL правильно обрабатывать UTF-8

Один из ответов на вопрос, который я задал вчера, предполагал, что я должен убедиться, что моя база данных может правильно обрабатывать символы UTF-8. Как я могу это сделать с MySQL?

102 mysql utf-8

6

Использование StringWriter для сериализации XML

В настоящее время я ищу простой способ сериализации объектов (в C # 3). Я погуглил несколько примеров и придумал что-то вроде: MemoryStream memoryStream = new MemoryStream ( ); XmlSerializer xs = new XmlSerializer ( typeof ( MyObject) ); XmlTextWriter xmlTextWriter = new XmlTextWriter ( memoryStream, Encoding.UTF8 ); xs.Serialize ( xmlTextWriter, …

99 c# sql-server xml utf-8 xml-serialization

7

Как декодировать escape-последовательности Unicode, такие как «\ u00ed», в правильные символы в кодировке UTF-8?

Есть ли в PHP функция, которая может декодировать escape-последовательности Unicode, такие как " \u00ed" to " í" и все другие подобные случаи? Я нашел здесь аналогичный вопрос, но, похоже, он не работает.

97 php unicode utf-8 escaping decoding

10

Сколько символов может кодировать UTF-8?

Если UTF-8 имеет 8 бит, не означает ли это, что может быть не более 256 различных символов? Первые 128 кодовых точек такие же, как в ASCII. Но в нем говорится, что UTF-8 может поддерживать до миллиона символов? Как это работает?

97 utf-8 character-encoding ascii

3

Чтение InputStream как UTF-8

Я пытаюсь прочитать text/plainфайл через Интернет построчно. Код, который у меня есть прямо сейчас: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while ((readLine = in.readLine()) != null) { lines.add(readLine); } for (String line : lines) { out.println("> " + …

96 java utf-8 inputstream

5

Пример недопустимой строки utf8?

Я тестирую, как часть моего кода обрабатывает неверные данные, и мне нужно несколько серий байтов с недопустимым UTF-8. Можете ли вы опубликовать некоторые, а в идеале, объяснение, почему они плохие / где вы их взяли?

96 unit-testing utf-8

11

Элегантный способ поиска файлов UTF-8 с помощью спецификации?

В целях отладки мне нужно рекурсивно искать в каталоге все файлы, которые начинаются с отметки порядка байтов (BOM) UTF-8. Мое текущее решение - это простой сценарий оболочки: find -type f | while read file do if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ] then echo "found BOM in: …

94 php utf-8 shell text-editor

9

Чтение CSV-файла UTF8 с помощью Python

Я пытаюсь прочитать CSV-файл с акцентированными символами с помощью Python (только французские и / или испанские символы). Основываясь на документации Python 2.5 для csvreader ( http://docs.python.org/library/csv.html ), я придумал следующий код для чтения файла CSV, поскольку csvreader поддерживает только ASCII. def unicode_csv_reader(unicode_csv_data, dialect=csv.excel, **kwargs): # csv.py doesn't do Unicode; encode …

94 python utf-8 csv character-encoding

Вопросы с тегом «utf-8»