PDF для преобразования слова программного обеспечения?


48

Есть ли в Ubuntu бесплатное программное обеспечение, которое может преобразовать файл PDF в файл .doc?


Я думаю, что текущий принятый ответ не является правильным, потому что он не работает. Abiword работает!
Лео Леопольд Герц

Ответы:


18

openoffice(или в качестве альтернативы libreoffice) оба имеют плагины для импорта в pdf и функциональность экспорта в .doc ... хотя оба аспекта страдают от проблем с конвертацией AFAIK. Под этим я подразумеваю, что точность преобразования не всегда равна 100%.

Abiword также работает аналогичным образом, если OpenOffice не работает в вашей системе.


7
libreoffice --invisible --convert-to docx:"MS Word 2007 XML" file.pdfКогда я конвертирую pdf в docx / doc, он говорит: "convert /home/file.pdf -> /home/file.docx, используя фильтр: MS Word 2007 XML, ошибка: пожалуйста, проверьте входные параметры ... (SfxBaseModel :: impl_store <file : ///home/file.docx> fail: 0xc10) "
mohit

2
@mohit Ваше предложение не работает в Debian 8.5.
Лео Леопольд Герц

33

Загрузите Abiwordс Ubuntu Software Centerили вы можете установить его, введя следующую команду в терминале:

sudo apt-get install abiword

Затем выполните преобразование:

abiword --to=doc example.pdf

2
Я проголосовал за это решение, но я должен проинформировать людей, что по состоянию на 2018-10-25, результаты далеко не идеальны. Форматирование вообще не соблюдается.
Ганс Дерагон,

14

Я имел большой успех с PDF в Word онлайн . Это не настольное приложение, а сервис, который работает лучше, чем другие вещи, которые я использовал.


спасибо :) я сталкивался с этим раньше. но я искал программное обеспечение для настольных компьютеров. это не очень точно.
Виджей

5
Обязательно ознакомьтесь с политикой конфиденциальности этой службы, прежде чем загружать какие-либо личные документы.
Glutanimate

@ neo, вы случайно не нашли более точный сервис / инструмент?
Алекс

Я пробовал это на 2018-10-25. Форматирование не идеальное; пули были потеряны, отступ был неправильным (вероятно, из-за исчезнувших пуль). Тем не менее, стоит попробовать. Может быть, с более простым файлом PDF, это получилось бы лучше. Тем не менее, я нашел этот онлайн-сервис, который очень хорошо справился с небольшим количеством ошибок форматирования: pdf2docx.com
Ганс Дерагон,


4

Я предпочитаю сначала конвертировать файлы PDF в HTML, используя pdftohtml, включенный в пакет poppler-utils , например, с помощью скрипта Nautilus, просто состоящего из этой команды:

pdftohtml -noframes -q -p -c "$1" "${1%\.pdf}-img.html"

Затем я открываю полученный HTML- файл в LibreOffice Writer и (после небольшого редактирования) сохраняю как любой другой формат документа, который мне нравится.

Примечание. Добавление параметра -i в команду выше приводит к созданию файла HTML без изображений.


Это нонсенс. Он создает только изображения из PDF. если указано -i, создается пустой файл.
Гомункул Ретулли

5
@HomunculusReticulli Пожалуйста, попробуйте его с несколькими различными файлами PDF, прежде чем выносить такой вердикт ;-) Возможно, что файл PDF, который вы пробовали, на самом деле не содержит никакого текста, кроме изображений, и в этом случае будет полезна только некоторая программа распознавания OCR.
Сади
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.