Есть ли фильтр Linux, который преобразует HTML в простой и довольно отформатированный текст?


3

Я хотел бы отфильтровать html-ответ, поступающий с выхода cURL. Какой фильтр я должен применить? Просмотр html-контента с помощью Midnight Commander не проблема, он показывает их в виде довольно отформатированного простого текста, так что я думаю, что такой фильтр есть.

Ответы:


3

Мы называем эти фильтры «веб-браузерами» - программой, которая анализирует HTML-код и выводит симпатичный документ.

Links - это один из консольных веб-браузеров, который работает в Linux.

Elinks это еще один.

Также есть W3M .

Вы всегда можете скопировать свой HTML-код в текстовый файл и открыть его в браузере с графическим интерфейсом, например Firefox, Chrome, Opera и т. Д.

Пожалуйста, не используйте регулярные выражения для разбора HTML .

РЕДАКТИРОВАТЬ . Я только что понял, что вы можете захотеть улучшить ваш HTML и увидеть его с помощью тегов. В этом случае вы можете использовать HTML Tidy Library Project или

скопируйте ваш HTML в текстовый файл и окружите его <pre> </pre>тегами. Затем откройте его с помощью браузера.


+1 за «Мы называем эти фильтры« Веб-браузеры »« Ха!
Lornix

1

Если вы просто хотите посмотреть привлекательный html-вывод curl, тогда достаточно w3m, links или lynx, как указано выше.

Если вы хотите проанализировать или сделать что-нибудь с выходными данными, то я рекомендую либо пакет html-xml-utils linux, либо Beautiful Soup, который является очень удобным пакетом Python для любого проекта, который включает в себя очистку веб-страниц.



0

Полночный командир использует «ссылки» или «рысь». Я подозреваю, что у вас установлен один из них, если вы видите проанализированный HTML в mcview.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.