У меня есть HTML-файл с большим количеством%-кодированного текста UTF-8 в URL.
Например, «% D1% 80% D0% B5% D1% 81% D1% 83% D1% 80% D1% 81% D1% 8B» означает «ресурсы» («ресурсы» на русском языке).
Задача состоит в том, чтобы заменить все такие подстроки читаемым текстом UTF-8.
Чтобы упростить задачу, мы можем рассмотреть, что %
в файле нет другого использования знака. Буквы могут быть как прописными, так и строчными.
Я подозреваю , что это может быть сделано элегантно с sed
, perl
, awk
или что - то , но не знаю , как.
Это веб-приложение, кажется, делает трюк с текстом, который вы вставляете туда.