Вопросы с тегом «character-encoding»

Вопросы, которые касаются различных представлений символов и наборов символов, таких как: ASCII, UTF-8, EBCDIC и другие. Часто встречается при перемещении файлов между операционными системами, которые кодируют новые строки с возвратом каретки и / или символами новой строки.

3
Как исправить русские буквы в приложении Wine при настройке LANG не помогает?
Приложение с русским пользовательским интерфейсом показывает вопросительные знаки вместо большей части своего текста (хотя некоторые элементы отображаются нормально). Язык системы английский (en_US, en_IE), я пробовал Ubuntu ant XUbuntu 12.04 с Wine 1.5. Я пытался запустить приложение с LANG=ru_RU.utf8 wine myapp.exe но это не помогает Я также проверил, что ttf-mscorefonts-installerустановлено. Если …

2
Несколько вопросов о кодировке символов файловой системы в Linux
Из-за большого объема обмена файлами между Windows ( кодировка GBK ) и Linux ( кодировка UTF-8 ), он легко столкнется с проблемами кодировки символов, такими как: Файлы zip / tar, имя которых содержит китайские символы в системе Windows, разархивируйте / разархивируйте их в системе Linux. запустить перенесенное устаревшее веб-приложение на …

2
Почему wc -m и wc -c разные?
Как программист на Си, я был удивлен, увидев, что wc -c(который подсчитывает количество байтов) и wc -m(который подсчитывает количество символов) выдает очень разные результаты для моего длинного текстового файла. Мне всегда говорили, что sizeof(char)это 1 байт. qdii@nomada ~/Documents $ wc -c sentences.csv 102990983 sentences.csv qdii@nomada ~/Documents $ wc -m sentences.csv …

2
Какие кодировки символов поддерживаются posix?
POSIX определяет поведение инструментов , таких как grep, awk, sed, и т.д. , которые работают против текстовых файлов. Поскольку это текстовый файл, я думаю, что есть проблема (ы) кодировки символов. Вопрос: Какие кодировки символов поддерживаются POSIX? (или текстовые файлы какой кодировки могут обрабатываться системами, совместимыми с POSIX?)

4
поддержка кодировки utf-8 с помощью lpr
При попытке отправить текстовый файл на принтер через lprс xterm, содержание было испорчено до неузнаваемости, причиной которого была в конечном счете восходит к кодированию файла. Если я вместо этого обработаю текст с помощью iconv(например, iconv -f utf-8 -t ascii//TRANSLIT), то файл печатается нормально. Еще одно предложение, с которым я столкнулся, …

2
терминал: отображение специальных символов
В некоторых программах, таких как htopлинии и кадры, отображаются неправильно. Вместо этого они отображаются как -и /. Но на другой машине они отображаются правильно в виде правильных строк: Я не уверен, является ли это проблемой терминала, или, возможно, необходим какой-то пакет. Если это актуально: моя система Debian Wheezy, мой переводчик …

3
Влияние $ LANG на терминал
Я пытаюсь узнать, как $LANGпеременная ведет себя с gnome-терминал (и его параметр предпочтения кодировки символов). Я использовал iso8859-1 (latin1) в качестве основного набора символов, и все мои имена файлов закодированы как таковые. Для следующих тестов я создам ls -lкаталог с испанскими символами в именах файлов: Дело 1: GNOME-терминал настроен для …

1
Почему мои имена файлов выглядят «нормально» в Linux, а не удаленно в Windows?
Во время работы с коллегой я обнаружил странную проблему, которая, похоже, связана с кодированием. Мы работаем с некоторыми изображениями , которые имеют достаточно простые имена файлов , таких как city.gifили wine.gif, но как можно было бы ожидать , все становится более сложным при использовании специальных символов , таких как é, …

1
Некоторые приложения не принимают символы из клавиши «Создать»
Проблема в том, что ключ compose работает нормально, но некоторые приложения не принимают некоторые символы из него. Например, я могу напечатать символ ∞в Emacs ( Compose+ 8+ 8), но это не сработает в FireFox, Konsole и Kate. Но многие другие символы, например €набранные там (в FireFox, Konsole и Kate) с …

4
Как я могу определить странного персонажа?
Я пытаюсь определить странный символ, который я нашел в файле, с которым я работаю: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 Файл использует кодировку ISO-8859 и не может быть преобразован в UTF-8: …

2
специальный символ в имени файла (\ # 033OA)
У меня небольшая проблема с очень упрямой ошибкой во время rsync. Это вызвано файлом со специальным символом в имени файла. Были и другие, но я мог бы разобраться, выполнив некоторые преобразования в кодировке имени файла. Однако этот файл я даже не могу найти. Итак, вот что говорит rsync: ../.\#033OA.tex.pyD0MB" failed: …

2
Укажите кодировку с помощью libreoffice --convert-to csv
Файлы Excel могут быть преобразованы в CSV с помощью: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx Кажется, все работает нормально. Кодировка, однако, настроена на что-то шаткое. Вместо UTF-8 mdash (-), который я получаю, если я делаю «сохранить как» вручную из LibreOffice Calc, он дает мне \ 227 ( ). …

3
Обработка файла, который начинается с спецификации (FF FE)
Я получил файл .csv с FF FEспецификацией: $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| При использовании awkдля анализа я получаю кучу нулевых байтов, что, как я подозреваю, связано с порядком байтов. Как …

1
`^ M` в конце каждой строки текстовых файлов, сгенерированных под Windows
Мне было интересно, почему, если вы откроете текстовый файл, созданный в блокноте Windows под Unix, вы обнаружите, что он ^Mтам, где должна быть новая строка? Насколько я понимаю, в Windows каждая строка заканчивается \r\n, то есть 0x0D0Aв ASCII, в то время как ^Mимеет значение ASCII 0x5E4D. Я не могу связать …

2
Как я могу изменить локаль / кодировку, чтобы избежать появления странных символов в терминале?
Я установил treeна свою коробку Ubuntu, когда я подключаюсь к нему из Putty и запускаю, treeя получаю это: $ tree âââ html.vim -> xml.vim âââ js.vim -> xml.vim âââ xml.vim вместо этого : $ tree --charset=ANSII |-- html.vim -> xml.vim |-- js.vim -> xml.vim `-- xml.vim Я также получаю эту …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.