Конвертировать веб-страницы в один файл для электронной книги


23

Я хочу скачать HTML (например: http://www.brpreiss.com/books/opus6/ ) и присоединить его к одному HTML или другому формату, который я могу использовать для чтения электронных книг. Сайты с бесплатными книгами не имеют стандартной подкачки страниц, они не являются блогами или форумами, поэтому не знаете, как выполнить автоматический обход и объединение.

Ответы:


13

Вы можете использовать Caliber для конвертации ваших электронных книг. Вы можете сделать это, чтобы создать одну книгу из нескольких HTML-файлов, ссылаясь на них из одного HTML-файла, который вы настроили как оглавление, подобное этому .


Я использую Sigil для конвертации в EPUB, но не знал, что Cailbre может сделать одну книгу из нескольких связанных htmls. Я постараюсь, спасибо!
Hrvoje Hudo

1
Вы можете использовать httrack.com для загрузки веб-страниц, а затем использовать Caliber, чтобы преобразовать их в формат ePub.
바 바

3
Мой процесс (с использованием Chrome) - использовать букмарклет Instapaper Text, чтобы немного очистить вещи, затем щелкнуть правой кнопкой мыши -> Сохранить как, выбрать сохранить как одну веб-страницу, только HTML, затем открыть это в Caliber, преобразовать в EPub, затем использовать функциональные возможности редактирования книги , чтобы привести в порядок любые дополнительные запутанные биты разметки , которые втянуты в.
El Yobo

6

То, как я делал это, было Caliber.

Это стало слишком большой болью, поэтому я создал Chrome Extension, чтобы упростить его.

Это называется EpubPress ( http://epub.press ).

Это позволяет создавать электронные книги из вкладок Chrome.

Надеюсь, это поможет!


3
Веб-сайт по вашей ссылке предполагает, что упаковка происходит на стороннем сервере, конфиденциальность НЕ гарантируется этим методом.
Бурги,

У вас есть предложения по изменениям, которые помогут вам чувствовать себя в большей безопасности? Я приложил все усилия, чтобы требовать только минимальную информацию для создания книги, но я открыт для дальнейших отзывов. Если вы посмотрите на любой аналогичный сервис, вы обнаружите, что любой контент, который вы хотите сохранить, отправляется на сервер. Разница в том, что для этих служб также требуется учетная запись и весь контент связан с вашим именем. Они также не предоставляют исходный код для своих сайтов, чтобы вы могли видеть, что они собирают. Это расширение с открытым исходным кодом, и я с удовольствием отвечу на любые вопросы об этом коде.
HaroldT

Какой отличный инструмент! Большое спасибо за бесплатное предоставление сообществу!
vonjd

5

Pandoc может взять ссылку на страницу (или HTML-файл) и преобразовать ее в pdf / epub ...

Я не уверен, что это будет ползти. Если этого не произойдет, вы можете сначала сканировать страницы с помощью wget или чего-то еще (или просто собирать ссылки) и передавать их pandoc.


в соответствии с man-страницей: «Вместо файла может быть задан абсолютный URI. В этом случае pandoc будет извлекать контент с помощью HTTP»
jopasserat


1

HTTrack является хорошим вариантом - он будет создавать электронную книгу с веб-сайта: ее можно скачать здесь: https://www.httrack.com/ HTTrack "позволяет загружать сайт World Wide Web из Интернета на локальный каталог, рекурсивно создавая все каталоги, передавая HTML, изображения и другие файлы с сервера на ваш компьютер. HTTrack организует относительную структуру ссылок исходного сайта. "

Затем вы можете конвертировать HTML в EPUB, AZW3 или PDF с помощью Caliber или любого другого программного обеспечения для конвертации HTML в epub.

Второй вариант для прямого преобразования в EPUB - это EpubPress: он имеет расширения, позволяющие использовать Firefox (только v44.0 +) или Chrome. Чтобы использовать это программное обеспечение, вам нужно открыть окно браузера. Каждая вкладка - это, по сути, «глава» в вашей электронной книге. Расположите вкладки в нужном порядке появления, затем активируйте epubpress - он загрузит и упорядочит вкладки в порядке их появления в формате .epub. Надеюсь это поможет!

* Однако обратите внимание, что EpubPress загружает отдельные веб-страницы, а не «веб-сайт», как делает HTTrack. Чтобы загрузить веб-сайт с EpubPress, вы должны открыть каждую ссылку на веб-сайте в виде отдельной вкладки, а затем использовать Epubpress для сбора этих ссылок в формате .epub.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.