Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.

16
UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1
У меня возникают проблемы с кодированием строки в UTF-8. Я пробовал множество вещей, в том числе с помощью string.encode('utf-8')и unicode(string), но получаю сообщение об ошибке: UnicodeDecodeError: кодек ascii не может декодировать байт 0xef в позиции 1: порядковый номер не в диапазоне (128) Это моя строка: (。・ω・。)ノ Я не понимаю, что …
106 python  unicode  utf-8 

3
Как я могу выполнить операцию «начинается с» с учетом языка и региональных параметров с середины строки?
У меня есть требование , которое является относительно неясным, но он чувствует , как это должно быть возможно с помощью BCL. Для контекста я анализирую строку даты / времени в Noda Time . Я поддерживаю логический курсор для моей позиции во входной строке. Таким образом, хотя полная строка может быть …
106 .net  string  unicode 

4
Как я могу перебирать кодовые точки юникода в строке Java?
Я знаю String#codePointAt(int), но он индексируется по charсмещению, а не по смещению кодовой точки. Я думаю попробовать что-то вроде: используя String#charAt(int)для получения charиндекса тестирование, charнаходится ли в диапазоне высоких суррогатов если это так, используйте String#codePointAt(int)для получения кодовой точки и увеличьте индекс на 2 если нет, используйте данное charзначение в качестве …
105 java  string  unicode 

5
Использование awk для удаления метки порядка байтов
Как бы awk выглядеть сценарий (предположительно однострочный) для удаления спецификации ? Технические характеристики: печатать каждую строку после первой (NR > 1 ) для первой строки: если она начинается с #FE #FFили #FF #FE, удалите их и распечатайте остальные

11
Как заставить интерпретатор Python правильно обрабатывать символы, отличные от ASCII, в строковых операциях?
У меня есть строка, которая выглядит так: 6Â 918Â 417Â 712 Четкий способ обрезать эту строку (как я понимаю в Python) - просто сказать, что строка находится в переменной с именем s, мы получаем: s.replace('Â ', '') Это должно делать свое дело. Но, конечно, он жалуется, что не-ASCII-символ '\xc2'в файле …
104 python  unicode 

9
Ошибка кодирования Unicode Python
Я читаю и разбираю XML-файл Amazon, и, хотя в XML-файле отображается ', при попытке его распечатать я получаю следующую ошибку: 'ascii' codec can't encode character u'\u2019' in position 16: ordinal not in range(128) Из того, что я читал в Интернете, ошибка возникает из-за того, что XML-файл находится в UTF-8, но …
104 python  unicode  ascii  encode 

12
Длина строки в байтах в JavaScript
В моем коде JavaScript мне нужно составить сообщение на сервер в следующем формате: <size in bytes>CRLF <data>CRLF Пример: 3 foo Данные могут содержать символы Юникода. Мне нужно отправить их как UTF-8. Я ищу наиболее кроссбраузерный способ вычисления длины строки в байтах в JavaScript. Я пробовал это, чтобы составить свою полезную …

5
Как поместить символ юникода в XAML?
Я пытаюсь это сделать: <TextBlock Text="{Binding Path=Text, Converter={StaticResource stringFormatConverter}, ConverterParameter='&\u2014{0}'}" /> Чтобы получить - появиться перед текстом. Не работает. Что мне здесь делать?
104 wpf  xaml  unicode  binding 

4
Python str против типов юникода
Работая с Python 2.7, мне интересно, какое реальное преимущество дает использование типа unicodeвместо str, поскольку оба они, похоже, могут содержать строки Unicode. Есть ли какая-то особая причина, кроме возможности устанавливать коды Unicode в unicodeстроках с помощью escape-символа \?: Выполнение модуля с помощью: # -*- coding: utf-8 -*- a = 'á' …
103 python  string  unicode 

4
Как использовать греческие символы в ggplot2?
Мои категории нужно называть греческими буквами. Я использую ggplot2, и он прекрасно работает с данными. К сожалению, я не могу понять, как разместить эти греческие символы на оси x (в отметках), а также сделать так, чтобы они появлялись в легенде. Есть ли способ это сделать? ОБНОВЛЕНИЕ: я просмотрел ссылку , …
103 r  graphics  unicode  utf-8  ggplot2 

8
Чтение символов из файла в Python
В текстовом файле есть строка «Мне это не нравится». Однако, когда я считываю это в строке, это становится «Я не \ xe2 \ x80 \ x98t как это». Я понимаю, что \ u2018 является представлением "'" в Юникоде. я использую f1 = open (file1, "r") text = f1.read() команда для …

5
Почему Apache Commons считает '१२३' числовым?
Согласно документации Apache Commons Lang для StringUtils.isNumeric(), строка '' является числовой. Поскольку я считал, что это могло быть ошибкой в ​​документации, я провел тесты, чтобы проверить утверждение. Я обнаружил , что в соответствии с Apache Commons он является числовым. Почему эта строка числовая? Что представляют собой эти персонажи?

6
Есть ли ошибки с использованием unicode_literals в Python 2.6?
У нас уже есть код, работающий под Python 2.6. Чтобы подготовиться к Python 3.0, мы начали добавлять: from __future__ импортировать unicode_literals в наши .pyфайлы (по мере их изменения). Мне интересно, делал ли кто-нибудь еще это и столкнулся с какими-либо неочевидными ошибками (возможно, потратив много времени на отладку).

7
Как я могу удалить символы, отличные от ASCII, но оставить точки и пробелы с помощью Python?
Я работаю с файлом .txt. Мне нужна строка текста из файла без символов, отличных от ASCII. Однако я хочу оставить пробелы и точки. В настоящее время я их тоже снимаю. Вот код: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') …
101 python  text  unicode  filter  ascii 


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.