Вопросы с тегом «unicode»

Unicode - это стандарт кодирования, представления и обработки текста с целью поддержки всех символов, необходимых для письменного текста, включая все системы письма, технические символы и знаки препинания.

18
Как использовать символы Юникода в командной строке Windows?
У нас есть проект в Team Foundation Server (TFS), в котором есть не английский символ (š). При попытке написать несколько вещей, связанных со сборкой, мы столкнулись с проблемой - мы не можем передать букву š инструментам командной строки. Командная строка или что-то еще портит ее, и утилита tf.exe не может …

10
Как исправить TypeError: Unicode-объекты должны быть закодированы перед хэшированием?
У меня есть эта ошибка: Traceback (most recent call last): File "python_md5_cracker.py", line 27, in <module> m.update(line) TypeError: Unicode-objects must be encoded before hashing когда я пытаюсь выполнить этот код в Python 3.2.2 : import hashlib, sys m = hashlib.md5() hash = "" hash_file = input("What is the file name …

6
SyntaxError: не-ASCII символ '\ xa3' в файле, когда функция возвращает '£'
Скажем, у меня есть функция: def NewFunction(): return '£' Я хочу напечатать кое-что со знаком решетки перед ним, и это выдает ошибку, когда я пытаюсь запустить эту программу, это сообщение об ошибке отображается: SyntaxError: Non-ASCII character '\xa3' in file 'blah' but no encoding declared; see http://www.python.org/peps/pep-0263.html for details Может кто-нибудь …

21
Как получить строковые объекты вместо Unicode из JSON?
Я использую Python 2 для анализа JSON из текстовых файлов в кодировке ASCII . При загрузке этих файлов с помощью jsonили simplejson, все мои строковые значения преобразуются в объекты Unicode вместо строковых объектов. Проблема в том, что я должен использовать данные с некоторыми библиотеками, которые принимают только строковые объекты. Я …


4
Почему этот код, написанный в обратном порядке, печатает «Hello World!»
Вот код, который я нашел в интернете: class M‮{public static void main(String[]a‭){System.out.print(new char[] {'H','e','l','l','o',' ','W','o','r','l','d','!'});}} Этот код печатается Hello World!на экране; Вы можете видеть, что это бежит здесь . Я ясно вижу public static void mainнаписанное, но это задом наперед. Как работает этот код? Как это вообще компилируется? Редактировать: я …


7
Заменить не-ASCII символы одним пробелом
Мне нужно заменить все не-ASCII (\ x00- \ x7F) символы пробелом. Я удивлен, что это не так просто в Python, если я что-то упустил. Следующая функция просто удаляет все не-ASCII символы: def remove_non_ascii_1(text): return ''.join(i for i in text if ord(i)<128) И этот заменяет не-ASCII символы количеством пробелов согласно количеству …

13
Python: удаление \ xa0 из строки?
В настоящее время я использую Beautiful Soup для анализа HTML-файла и вызовов get_text(), но мне кажется, что у меня осталось много \ xa0 Unicode, представляющих пробелы. Есть ли эффективный способ удалить их все в Python 2.7 и заменить их пробелами? Я думаю, что более общий вопрос будет, есть ли способ …
241 python  parsing  unicode 

12
Сколько байтов занимает один символ Unicode?
Я немного запутался в кодировках. Насколько я знаю, старые символы ASCII занимали один байт на символ. Сколько байтов требуется для символа Юникода? Я предполагаю, что один символ Unicode может содержать все возможные символы из любого языка - я прав? Так сколько байт нужно для каждого символа? А что означают UTF-7, …

5
Как я могу изменить кодировку файла с помощью vim?
Я привык использовать vim для изменения концов строк файла: $ file file file: ASCII text, with CRLF line terminators $ vim file :set ff=mac :wq $ file file file: ASCII text, with CR line terminators Можно ли использовать аналогичный процесс для изменения кодировки Unicode файла? Я пытаюсь следующее, которое не …
235 vim  unicode 

8
Записывает текст Unicode в текстовый файл?
Я вытаскиваю данные из документа Google, обрабатываю их и записываю в файл (который в итоге вставлю на страницу Wordpress). У него есть не-ASCII символы. Как я могу безопасно преобразовать их в символы, которые можно использовать в исходном коде HTML? В настоящее время я конвертирую все в Unicode по пути, объединяю …

5
В чем разница между _tmain () и main () в C ++?
Если я запускаю свое приложение C ++ с помощью следующего метода main (), все в порядке: int main(int argc, char *argv[]) { cout << "There are " << argc << " arguments:" << endl; // Loop through each argument and print its number and value for (int i=0; i<argc; i++) …
224 c++  unicode  arguments 

18
Как вы повторяете 4-значный символ Unicode в Bash?
Я хотел бы добавить череп и скрещенные кости Юникода в мою подсказку оболочки (в частности, «ЧЕРЕП И КРЕСТЫ» (U + 2620)), но я не могу понять магическое заклинание, которое заставило бы эхо выплюнуть его или любое другое, 4-значный Unicode символ. Двузначные легко. Например, echo -e "\ x55",. В дополнение к …

11
JavaScript + Юникод регулярные выражения
Как я могу использовать регулярные выражения с поддержкой Юникода в JavaScript? Например, должно быть что-то похожее на \wто, что может соответствовать любой кодовой точке в категории «Буквы или метки» (не только ASCII), и, надеюсь, иметь фильтры типа [[P *]] для пунктуации и т. Д.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.