Лев Толстой в своем малоизвестном романе « PDF Каренина» писал:
Оптимально закодированные файлы PDF одинаковы; каждый субоптимально закодированный файл PDF субоптимально кодируется по-своему.
Никто не может ответить, почему ваши PDF-файлы больше после того, как Preview модифицирует их. Файл PDF состоит из данных различных типов: изображения, потоки содержимого, шрифты, заголовок документа, цветовые пространства, расширенные графические состояния и таблица перекрестных ссылок. Точно так же одно предложение может быть кратким, а другое - многословным, но оба они действительны на английском языке и говорят одно и то же, поэтому и один файл PDF может иметь более подробный способ представления того же содержимого, что и более сжатый файл PDF. Нам нужно посмотреть ваши точные файлы PDF. Вполне вероятно, что они были созданы различными программными средствами, некоторые из которых состоят, некоторые менее.
Также имеет значение, какую версию Mac OS X и Preview вы используете, потому что это определяет программное обеспечение, которое записывает новый файл PDF, когда вы делаете Save As in Preview.
Однако я могу рассказать вам, что становится больше в некоторых моих PDF-файлах. Эта история относится к моему компьютеру под управлением Mac OS X 10.5.8 и Apple Preview 4.2 (469.5).
Один файл Giulio.pdf
- это 22-страничный документ с текстом в виде текста, а не с отсканированными изображениями. Это 461 092 байта. Я открыл его в Preview, сделал File ... Save As ... и сохранил его под новым именем файла. Новый файл имеет размер 724 421 байт, или на 57% больше.
Я открывал каждый файл в Adobe Acrobat Professional, версия 8.3.1 для Mac OS. Я сделал Advanced ... PDF Optimizer ... Аудит Space Usage ... . В небольшом диалоговом окне указывалось, сколько байт приходится на каждую категорию использования, а также процент от общего размера файла для категории.
Оригинал Giulio.pdf
имеет 390 754 байта (84,75%), выделенных для потоков контента, и ноль байтов, выделенных для изображений. Это в формате PDF 1.4. Файл, сохраненный в режиме предварительного просмотра, содержит 675 846 байт (93,29%), предназначенных для потоков контента, а также ноль байтов изображений, и имеет формат PDF 1.3. Предварительный просмотр увеличил потоки контента на 285 092 байта, что составляет 73% от разницы в размерах файлов.
Я задавался вопросом, был ли формат файла PDF 1.3 по своей сути менее эффективным для хранения файлов такого типа. Я открыл оригинал Giulio.pdf
в Adobe Acrobat Professional 8 и сделал Advanced ... PDF Optimizer ... Сделать совместимым с: Acrobat 3.0 и более поздними версиями и нажал OK. Я сохранил полученный файл под новым именем. Полученный файл имеет формат PDF 1.3 и имеет размер 452 356 байт или меньше, чем оригинал. Его потоки содержимого составляют 375 171 байт (82,94%), аналогичная пропорция, но меньше, чем потоки содержимого исходного файла.
Таким образом, кажется, мы можем заключить, что приложение Preview в Mac OS X 10.5.8 не так эффективно, как некоторые другие создатели PDF, создает сжатые потоки содержимого в файлах PDF, и разница достаточна для учета трех четвертей различия в размере. в PDF-файл без изображений.
Я провел аналогичный эксперимент на form k.pdf
1-страничном документе, отсканированном с бумаги. Исходный файл имеет размер 303730 байт, из которых 298 197 байт (98,18%) представляют собой изображения. Копия этого файла, созданного с помощью функции «Предварительный просмотр» с помощью команды «Сохранить как», составляет 300 601 байт или на 1% меньше. Эта разница в размере файла больше, чем учитывается меньшей байтовой категорией байтов в файле, созданном в Preview.
Таким образом, кажется, мы также можем сделать вывод, что предварительный просмотр не всегда приводит к увеличению размера файла PDF. Это зависит от характера исходного файла PDF и от того, насколько лаконичным он был для начала.