Linux file command


1

Я заметил, что fileкоманда Linux не возвращает никакого значения, если XML-файл имеет <?xml version="1.0" encoding="UTF-8"?>вверху. Если пролог отсутствует, file -i somefile.xmlвозвращает некоторое значение. У кого-нибудь есть идеи, почему это происходит? Я в основном заинтересован в знании кодировки файлов и нашел, file -i filename.xmlчто она несколько полезна, но есть ли что-нибудь лучше в Linux для определения кодировки и кодировки?

Ответы:


2

Файл основан на сигнатуре в волшебном файле , он вполне уверен, что он смотрит только на пролог, а не сканирует части файла, чтобы упростить его.


Это то, что мне интересно, что, возможно, он просто смотрит на пролог, который не очень полезен, потому что я могу закодировать файл в X и написать Y в прологе

1

Догадываться о кодировках - это черное искусство, которое даже в популярных браузерах не может быть абсолютно правильным. Я предлагаю вам позволить вашему синтаксическому анализатору подчиняться кодировке XML, громко ломаться, если кодировка оказывается недействительной, и что вы исправляете ошибки кодирования в источнике.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.