Есть простой способ напечатать все символы не-ASCII и номера строк , на которых они происходят в файле с помощью утилиты командной строки , такие как grep
, awk
, perl
и т.д.?
Я хочу изменить кодировку текстового файла с UTF-8 на ASCII, но перед этим я хочу вручную заменить все экземпляры не-ASCII символов, чтобы избежать неожиданных изменений символов, вызванных процедурой преобразования файлов.
LC_ALL=C grep -n -P [$'\x80'-$'\xFF']
где первый бит отключает сортировку.