Является ли PDF очень неэффективным?
Не особенно, как показывает ваш комментарий к Q:
потому что PDF 10 фото в оттенках серого, 6,35 МБ!
Все зависит от разрешения и уровня сжатия.
По сути, ответ таков: полные страницы довольно большие, а типичные разрешения при сканировании и печати довольно высокие: таким образом, большое количество данных.
Основной расчет:
A4 составляет около 8,3x11,7 дюйма (буква похожа, отличается не имеет значения). Итак, одна страница - 97 на 2 .
При разрешении 300 точек на дюйм 1 на 2 составляет 90000 пикселей. При 24 битах на пиксель (достаточно для 16 миллионов цветов) это около 260 КБ.
Таким образом, для 100in 2 потребуется около 26 МБ. Это соответствует вашим цифрам. NB Оттенки серого при 8 битах на пиксель (256 уровней) требуют примерно трети этого.
1 ГБ промежуточных файлов
Но если вы хотите получить конечный вывод 300 точек на дюйм, вам действительно нужно работать с более высоким разрешением до финальной стадии вывода (чтобы избежать артефактов: просто попробуйте несколько раз открыть и сохранить заново JPEG с даже умеренным сжатием, чтобы увидеть, как они быстро появляются).
Мой старый сканер (> 8 лет?) Работал бы со скоростью 2400 точек на дюйм (IIRC), поэтому что-то вроде 600 точек на дюйм было бы в пределах досягаемости большинства сканеров, так как это линейное измерение, для каждой области - и, следовательно, размер файла - увеличится с квадратом, что приводит к размеру файла в четыре раза больше.
Т.е. 100 МБ на изображение, поэтому следует ожидать 1 ГБ на 10.
Но конечный результат намного меньше
Это почти наверняка сжато. Безупречное сжатие изображений с большими областями постоянного цвета часто может быть сжато в 10 раз без существенной потери воспринимаемой информации для сканов и фотографий (которые имеют тенденцию иметь большое количество небольших вариаций, которые мы видим только при экстремальных уровнях масштабирования ) некоторые потери являются нормальными (как использует JPEG) и достигаются аналогичные коэффициенты сжатия.
Насколько большой это может быть?
Pro-DSLR используют 14 бит на цвет (сканер высокого уровня также должен уметь), то есть 42 бит на пиксель. Сканирование формата A4 со скоростью 4800 точек на дюйм приведет к получению необработанных данных размером GB11 ГБ для одной страницы.