«Распечатать» веб-страницу в pdf с работающими гиперссылками


11

Я печатаю множество веб-страниц в формате pdf, используя CutePDF. URL-адреса поддерживаются как активные ссылки в документе PDF, но гиперссылки не генерируют активную ссылку.

Есть ли какой-нибудь, желательно бесплатный, PDF-принтер, который поддерживает активные гиперссылки при печати веб-страниц?

(И, пожалуйста, не советуйте никаким инструментам, которые специально не делают этого)

Я использую Firefox, но не думаю, что браузер должен иметь значение.


Не уверен, что именно вы подразумеваете под маскированными гиперссылками. Согласно известному определению маскированной гиперссылки это не имеет значения для PDF-принтера. На самом деле PDF-принтер не имеет возможности узнать, к чему ведет гиперссылка, поэтому он не различает замаскированные и немаскированные ссылки.
Арт Гертнер

СМЦ; Я просто имею в виду обычный текст с гиперссылкой, такой как; superuser Если замаскировано неверно, какой термин для этого?
bretddog,

Термин гиперссылка . Не имеет ничего общего с маскировкой. Обычный текст называется URL . Гиперссылка - это интерактивный объект, по которому вы переходите на URL . Пожалуйста, прочитайте вики: гиперссылка и вики: URL . Также не забудьте обновить свой вопрос (включая заголовок)
Арт Гертнер

Ответы:


4

Сначала я должен заверить вас, что имеет значение, какой браузер вы используете. Если вы не используете стандартный диалог печати ОС, браузер будет использовать свою собственную библиотеку для создания PDF. Результаты будут отличаться в разных браузерах.

Так же, как эксперимент, я напечатал эту страницу, используя Firefox и Chromium. Firefox не сохранил никаких кликабельных ссылок. Хром сэкономил около 50%, и выбор казался довольно случайным.

Я считаю, что лучшим решением для вас было бы установить надстройку / расширение для браузера, которое выполнит эту работу.

Я сделал быстрый поиск, и для Firefox я нашел этот: имя с невообразимым названием Print pages to Pdf . Прямая ссылка на последнюю версию: 0.5.0.6 .

Создает один файл PDF из любого количества открытых страниц браузера, закладок / папок, альбомов Scrapbook (Plus). Этот документ может быть заархивирован, отправлен [sic] по электронной почте или распечатан любым стандартным средством просмотра PDF.

если вы просмотрите список функций, вы найдете то, что ищете:

  • Сохраняет ссылки в формате PDF с содержания веб-страниц
  • Поддерживает локальные ссылки для навигации по веб-странице / pdf

Я кратко проверил его, и он правильно распечатал страницу со всеми кликабельными ссылками.


Ну, это выглядит довольно круто! :) Пока хорошие результаты и несколько приятных вариантов. Спасибо!
bretddog

1
Эти ссылки мертвы.
AllInOne

1
@AllInOne, обновлено
Арт Гертнер

@ArtGertner Ссылки на любую версию этого мертвы. (Я любил плагин раньше ..)
Малахи

5

Использование встроенного в Chrome виртуального принтера «Сохранить как PDF» - это еще один вариант. Это сработало для меня, когда расширение Firefox «печатать страницы в PDF» плохо испортило страницу (но действительно сохранило гиперссылки)


Документы W3C, такие как w3.org/TR/xmlschema11-1/#composition-schemaImport , похоже, не работают с таким подходом: связанный документ НЕ доступен для поиска, а ссылки НЕ работают.
Коппор

Только что протестировал эту страницу с последней версией Chrome. Документ доступен для поиска и внешние ссылки работают. Внутренние ссылки (на якорь на странице) НЕ РАБОТАЮТ (что является большой проблемой для этого типа документа). Использование «Печать страниц в PDF», кажется, дает лучший результат с этой страницей: с возможностью поиска, с работающими внешними и внутренними ссылками, и, похоже, правильно сохраняет макет.
Хетчел

3

wkhtmltopdf

На основании Печать страниц в PDF я предлагаю автономный инструмент wkhtmltopdf .

"c:\Program Files\wkhtmltopdf\bin\wkhtmltopdf" "http://www.example.com" test.pdf

Pandoc

wkhtmltopdf не работал в моем случае , поэтому я рекомендую Pandoc . Это немного сложнее, чтобы запустить его. С небольшими документами вы должны быть в состоянии запустить

pandoc http://www.example.org/ -o test.pdf

Если у вас есть документы UTF-8 с китайскими иероглифами, вы должны сделать это следующим образом:

pandoc http://blog.fefe.de/ -o test.tex
lualatex test.tex
lualatex test.tex

работа в процессе

Однако в моих конкретных настройках pandoc http://www.w3.org/TR/DOM-Parsing/ -o test.pdfэто привело к ошибке LaTeX.

! LaTeX Error: Too deeply nested.

Поэтому я создал файл латекса вручную:

pandoc http://www.w3.org/TR/DOM-Parsing/ --standalone -o test.tex

Затем мне пришлось отключить линию 78, потому что an \includegraphicsбыл внутри \href.

С предложенным хаком в stackoverflow (вставленный в строку 74, прямо перед \begin{document}), я также не смог запустить его ( pdflatex test).

Я открыл выпуск № 2438 в Пандоке.


2

Плагин «Печать страниц в PDF» больше не доступен в Firefox. Я попробовал альтернативу, перечисленную в этой и других темах, но безуспешно.

Что работает:

  • Используйте панель инструментов Adobe PDF для Internet Explorer.
  • Используйте функцию «Преобразовать веб-страницу в PDF» на панели инструментов.

По состоянию на 2015-10-07 Печать страниц в PDF по-прежнему доступна: см. Printpdf.pf-control.de/index.php/en/0.5.0.2.html
koppor

Спасибо за ваш комментарий. Я проверил сайт, на который вы ссылались, и следовал инструкциям по установке ( printpdf.pf-control.de/index.php/en/installation.html ). Эта страница ссылается на addons.mozilla.org/en-US/firefox/addon/. print-pages-to-pdf, где написано: «Это дополнение удалено его автором».
Эрик Т. Вийк

Пожалуйста, перейдите по ссылке, приведенной в первом абзаце моей ссылки. Текст гласит: «Если вы хотите скачать эту версию, вы можете сделать это по этой ссылке. (Если вы уже скачали 0.5.0.1, эта идентичная)». «Эта ссылка» ссылается на printpdf.pf-control.de/versions/0.5.0.2/xpi/…
koppor

1

Существует FireFox Addon «save-as-pdf», который сохраняет гиперссылки в PDF-документе: https://addons.mozilla.org/en-US/firefox/addon/save-as-pdf/

(это бесплатно, но разработано коммерческой компанией http://pdfcrowd.com )


Стоит отметить, что это преобразование осуществляется в Интернете. Аддон отправляет URL-адрес в онлайн-сервис pdfcrowd, который преобразует его и возвращает PDF. Я не буду использовать это дополнение из-за проблем с конфиденциальностью - я не хочу знать pdfcrowd, какие сайты меня интересуют. Кроме того, будьте готовы к разного рода утечкам конфиденциальных данных при использовании этого сервиса (конфиденциальное содержимое страницы в вопрос, идентификаторы сеанса, закодированные в URL и т. д.), а также для аддона, не работающего, если данные входа / идентификатор сеанса передаются рассматриваемому веб-сайту посредством почтовых запросов.
Бинар
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.