Лучшие настройки камеры для фотографирования текста?


11

Я использую свой S95 для фотографирования текстовых документов (как бумажных, так и микрофильмов) для распознавания текста. Я уже спрашивал о том, как лучше сфотографировать компьютерный экран для микрофильма, но я думал о том, как лучше сфотографировать текст, чтобы текст получался четким и четким. Вот мои нынешние мысли, но я хотел бы услышать, что может сказать любой, у кого больше опыта в фотографии:

  1. Я использую меньшее количество мегапикселей (около 6-7 мегапикселей, а не максимум S95, который составляет 10 мегапикселей), чтобы получающиеся в результате файлы PDF не убивали мой компьютер, когда я фактически выполняю их прокрутку

  2. Диафрагма - ниже (например, f / 6.3), так что если камера не точно параллельна странице, текст будет оставаться в фокусе

  3. Скорость затвора - здесь есть компромисс, потому что библиотеки, как правило, при слабом освещении, поэтому я хотел бы снизить выдержку, увеличив выдержку, но без штатива есть вероятность колебания камеры.

  4. ИСО - я не совсем уверен, как это повлияет на это.

  5. Баланс белого - Опять же, не совсем уверен.

Я экспериментировал с различными настройками на своей камере, но я только изучаю фотографию и хотел бы знать, есть ли у кого-нибудь какие-либо предложения о том, как лучше всего фотографировать текст из книг или документов, которые легко читать.


3
Почему бы просто не использовать правильный инструмент для работы и использовать сканер?
Ахокли,

7
«Почему бы просто не использовать правильный инструмент для работы и использовать сканер?» - Потому что многие документы, с которыми я работаю, не сканируются. Они либо очень хрупкие, либо библиотека не позволяет вам сканировать, либо библиотека взимает непомерные затраты на сканирование свыше $ 0,50 / страница.
Джейсон

2
Я хотел бы, чтобы об этом было сказано: я надеюсь, что ваше использование должным образом уважает авторские права, если и в соответствующих случаях. :) Предполагая, что так, я надеюсь, что вы найдете свои ответы!
Линд

3
«Я надеюсь, что вы используете надлежащим образом уважающие авторские права» - Да, моя работа с документами вне ограничений авторского права (я историк, в основном изучаю Европу конца 19-го века)
Джейсон

2
@ahockley: еще одна причина не сканировать это то, что это занимает очень много времени. С DSLR я могу делать около 20 страниц в минуту на столе, но сканер, который быстро использует устройство подачи документов и стоит дорого.

Ответы:


7

Если ваша камера имеет черно-белый режим, я бы попробовал это уменьшить ваше время постобработки. Кроме того, многие программы OCR, с которыми я работал, намного лучше работают в черно-белом режиме.

Вы хотите, чтобы страница была как можно более параллельной, поскольку для уменьшения дрожания камеры при удерживании руки вам, вероятно, понадобится самая широкая диафрагма, чтобы максимально увеличить выдержку затвора. Маленький сенсор на вашем s95 должен увеличить вашу DOF настолько, чтобы я открывал диафрагму настолько широко, насколько вы можете сойти с рук.

Учитывая, что вы просто собираетесь запустить это через OCR, поднимите ISO до того, что дает вам правильную экспозицию с минимальным колебанием. OCR гораздо реже будет жаловаться на дополнительный шум, чем размытые буквы.

Баланс белого, если вы просто говорите о тексте, должен соответствовать вашим «внутренним» настройкам камеры - но, честно говоря, не слишком переживайте по этому поводу.

Ваши мегапиксели могут иметь значение только в том случае, если текст вашего документа невероятно мал, и вам необходимо четко разрешить этот уровень детализации, но я думаю, что 6-7 подойдет для большинства вещей.


1
Вы, вероятно, имеете в виду «перпендикулярно странице». Если вы параллельны, вам будет трудно читать текст. ;-)
Крейг Уокер

@Creig Walker - он использовал термины «параллель» странице, и я поняла, что он имел в виду, поэтому я не пыталась запутать его. Не говоря уже о том, что сам датчик будет параллельным, как и видоискатель. Это зависит только от того, на какую часть камеры вы ссылаетесь. Термин был намеренным.
rfusca

Используйте максимально возможное количество мегапикселей, документы OCR - это то, что имеет значение, и они будут относительно крошечными и до тех пор, пока источником является весь текст, в любом случае не зависит от разрешения камеры. Я использую Abbyy FineReader, и он лучше работает на изображениях с более высоким разрешением (21MP вместо 10MP, например). Так что стреляйте в 10MP.

справедливо.
Крейг Уолкер

+1 для черно-белого режима. RGB для обработки текста тратит впустую пиксели.
Грег

2

Похоже, вы уже хорошо разбираетесь в настройках. Встряхивание камеры нарушит читабельность текста больше, чем что-либо еще, поэтому я бы сначала оптимизировал это. Если вы не можете использовать штатив, убедитесь, что скорость затвора составляет не менее 1 от фокусного расстояния (эквивалент 35 мм). Уменьшение сделает это проще. Используйте стабилизацию изображения, если она у вас есть.

Диафрагму можно установить достаточно широко, просто убедитесь, что вы параллельны странице. Широкая диафрагма поможет с выдержкой, опять же размытие из-за широкой диафрагмы - ничто по сравнению с размытием из-за движения камеры!

ISO, все, что вам нужно, чтобы получить хорошую экспозицию. Шум не должен влиять на читаемость, пока он не станет действительно плохим.

Съемка пользовательского баланса белого на основе самой бумаги была бы предпочтительнее, но программное обеспечение OCR должно справляться с не совсем белым фоном.


1
  1. Я предполагаю, что вы конвертируете JPEG в PDF. Я рекомендую захватить максимум и использовать программу для уменьшения до 6-7 Мп с резкостью, примененной после уменьшения и перед преобразованием в PDF.

  2. Чтобы уточнить, вы хотите более узкую апертуру для большей глубины резкости, которая является большим числом диафрагмы. (например, вы хотите F / 8 вместо F / 2). Чтобы текст был удобочитаемым, старайтесь, чтобы камера была направлена ​​как можно более перпендикулярно, чтобы вам не приходилось беспокоиться о глубине резкости. Хорошей идеей будет немного остановиться от широко открытого, чтобы уменьшить аберрации, такие как CA, которые вы увидите черным по белому тексту. Чем ближе вы к бумаге, тем меньше будет глубина резкости.

  3. Это, вероятно, будет иметь наибольшее влияние на удобочитаемость, если вы держите в руках. Если вы держите в руках, вы хотите выбрать выдержку затвора так, чтобы она была больше 1 / (эквивалентное фокусное расстояние 35 мм) или даже быстрее. Это зависит от того, какую настройку зума вы используете на своем приборе. Если вы используете широкий конец, вы можете уйти с более длинными выдержками, но можете получить искажение ствола. Если вы фотографируете текстовые документы, а не экран компьютера, я рекомендую попробовать вспышку.

    Если вы можете, подпишите документ вверх (приклеив его пленкой или чем-то таким, чтобы он был ровным), чтобы вы могли положить камеру на что-нибудь и получить как можно более длинную выдержку. Вы также можете использовать мешочек с бобами или небольшие предметы, чтобы наклонить камеру, когда она отдыхает. Кроме того, вы можете приобрести адаптеры штатива для P & S.

  4. Диафрагма, выдержка и ISO образуют треугольник экспозиции. Читайте об этом здесь . Чем выше ISO, тем более узкую диафрагму и более короткую выдержку вы можете использовать, но изображение будет более шумным. Я рекомендую низкий ISO (400 или меньше) для P & S с текстом.

  5. Выберите баланс белого для вашей ситуации освещения. Если у вас есть флуоресцентный свет, используйте это. Если вы используете вспышку, используйте баланс белого вспышки.


Я не думаю, что f / 8 является реалистичным для съемки с рук в помещении (если только вы не используете вспышку, вам нужно сначала спросить у библиотеки разрешение), плюс f / 8 вызовет отвлечение внимания небольшим сенсором, усиление резкости минимально по сравнению с требуемым увеличением времени затвора / ISO.
Мэтт Грум

@Matt f / 8 является примером, показывающим, что он хочет, чтобы большее число увеличивало глубину резкости (и уменьшало другие аберрации, такие как CA, которые могут быть видны). Я не давал ему указаний, так как не уверен, сколько у него света. Отвлечение? Вы имеете в виду дифракцию?
Eruditass

Да, я имел в виду дифракцию - я пишу это на своем телефоне, у которого есть раздражающая привычка автоматически исправлять мои слова, даже когда я пишу их правильно. CA не будет серьезной проблемой (по сравнению с дрожанием камеры), я думаю, что вам лучше всего остановиться с широко открытыми, если свет - большая проблема ...
Мэтт Грум

Разве вы не любите технологии? Да, я бы сказал, что одна остановка из широко открытого положения - хороший ориентир, и согласен, что дрожание камеры - это суть.
Eruditass

Это действительно хорошее предложение снимать с максимальным количеством MP, а затем уменьшать частоту на компьютере. Я могу себе представить, что повышение резкости + дополнительная контрастность приведут к гораздо более четкому тексту, который будет легче читать
Джейсон

1

Я согласен с предложениями по съемке в самом высоком разрешении и уменьшении размера в компьютере. Также выберите jpeg высочайшего качества, который вы можете получить от вашей камеры, или даже снимайте в сыром виде, если ваша камера это позволяет, и конвертируйте в tiff или png. Сжатие с потерями в формате JPEG может создать артефакты вокруг границы чернил / бумаги, которые могут запутать ваше программное обеспечение ocr.

В общем, вам нужно использовать настройки, которые позволят получить максимально четкое изображение. Такие вещи, как контраст, баланс белого и т. Д. Могут быть изменены в компьютере. Фактически, увеличение контраста с помощью инструмента «Уровни» или инструмента «Контраст / Яркость» в фотошопе или GIMP может вам очень помочь.

Кроме того, преобразование в формат градаций серого существенно уменьшит размер ваших файлов. И если вы сделаете это и увеличите контраст, вам не нужно беспокоиться о балансе белого. Вы можете поэкспериментировать с балансом белого, однако, некоторые настройки могут производить лучшую контрастность, чем другие (это зависит от вашего освещения).

Если ваш компьютер может с этим справиться, сделайте все корректировки (оттенки серого, контрастность, яркость) до того, как вы уменьшите размер, а после уменьшения, примените к изображению некоторый фильтр повышения резкости.


1

Несколько мыслей, которые я не заметил в другом месте, чтобы добавить к смеси:

  • Если вы снимаете «увеличенный» (больше телефото ), это заставит вас снимать дальше от страницы, что даст вам более согласованное изображение по размеру текста (слова в углу будут ближе к тот же размер, что и слова посередине; при широкоугольном изображении вы можете получить искажения по этому поводу). Я не уверен, что здесь «идеальный» параметр, и это компромисс с необходимыми выдержками, возможно, просто о чем подумать.

  • Возможно, вы захотите « переэкспонировать » по сравнению с тем, что ваша камера, вероятно, считает правильным по умолчанию (если только он не достаточно умен, чтобы догадаться, что это бумага - я поместил это в кавычки, потому что вы действительно не хотите переэкспонировать его просто переэкспонировать на основе отмеривания белой страницы), потому что основной тон (сама бумага) будет основным для камеры, и если вы выставите бумагу как средне-серый, вы получите грязная отправная точка. Если вы «переэкспонируете» с помощью остановки от полутора до двух остановок (только не переходите к точке обрезки светлых участков), текст все равно должен быть красивым и темным, но бумага будет красивой и яркой, с контрастным разделением ( и, следовательно, OCR) проще.

  • старайтесь иметь равномерное освещение - если один угол страницы намного светлее или темнее другого, это усложнит разделение элементов на чистый черный и чистый белый, который вам, скорее всего, понадобится для целей распознавания текста.

  • «Подставка для копирования» идеально подходит для таких проектов, как этот, хотя я полагаю, что вы не можете легко это сделать в библиотеке ... Однако, в зависимости от того, как настроена ваша библиотека, возможно, что она может быть где-то (возможно, на полке стол, или стержень, который держит освещение или что-то подобное?), чтобы вы могли разместить супер зажим с шаровой головкой ( вот такой , но любой супер зажим с подходящим по размеру (в зависимости от головы) «шпилькой» и своего рода штативом с головой), и ваша камера затем будет установлена ​​на поверхность стола (или любую другую), чтобы вы могли иметь постоянное позиционирование и стабильность в случае необходимости более длительной экспозиции. По сути, это равносильно копировальному киоску "бедняка".

    Вы также можете использовать короткий автоспуск или дистанционное управление (я полагаю, что ваша камера имеет 2-секундный режим автоспуска, и, возможно, собственный, который может быть еще короче), чтобы избежать дрожания камеры от нажатия кнопки.

Это все, о чем я сейчас думаю. Надеюсь, это полезно.


1

У меня та же работа, что и у вас, фотограф, и я делал это годами. Большинство людей не знают, о чем они говорят, поверь мне !!!

  1. Камера на М или ручная

  2. ISO 100-200, чем выше #, тем ярче, но на изображении получается больше зерна или шума

  3. Скорость затвора от 1/100 до 1/160 (обычно 1/125 лучше, чем ниже, тем ярче, но вы получаете больше погребений или повторов)

  4. Диафрагма или f2.7 (зачем вам глубокое поле зрения, это плоская страница)

  5. Снимайте в цвете, от 6 до 10 мегапикселей, просматривайте настройки баланса белого, обычно флуоресцентные 1 или 2, выключайте большинство колоколов и свистите, если Ур не уверен, выключите его

  6. выставить фото на комп используя acdc


0

Несколько небольших предложений, но я думаю, что ваша установка выглядит хорошо

  1. Используйте штатив. Это устранит любые проблемы с дрожанием камеры и позволит вам использовать столько времени, сколько вам нужно.

  2. Избегайте попадания света прямо на бумагу под углом, который может отражаться прямо в объектив и вызывать блики там, где они вам не нужны. Обычно это означает, что свет идет с боков.

  3. ISO: как правило, вы должны ошибиться в сторону более низкого значения, но я уверен, что любое материальное различие быстро станет очевидным.

Кроме того, я не могу придумать какие-либо способы улучшить ваши настройки. Если честно, я думаю, что вы поняли.


Можете ли вы предложить хороший (и относительно недорогой) штатив, который был бы полезен, и позволил бы мне перевернуть камеру так, чтобы она была параллельна страницам, которые я фотографирую? Я смотрел на штативы Joby, и они выглядят многообещающе, но я слышал, что они часто меняются, когда вы нажимаете на затвор.
Джейсон

@ Джейсон, честно. У меня есть Joby, который мне нравится, но чтобы остановить его движение, когда вы нажимаете на затвор, просто используйте дистанционный спуск затвора или используйте автоспуск. На самом деле это хороший совет, если вы используете медленную выдержку. Плохая новость в том, что любой штатив, достаточно тяжелый, чтобы быть очень стабильным, не будет дешевым. Извини за это! (Если вы узнаете иначе, дайте мне знать!);)
AJ Finch

0

Похоже, у вас уже есть большинство ответов :-P Я просто добавлю несколько комментариев на ваши вопросы:

  1. Разрешение: вы правы, вам не нужно много разрешения, особенно если вы просто собираетесь просматривать изображения на экране. Я бы, наверное, ограничил его вдвое максимальным разрешением экрана.

  2. Диафрагма: вы правильно выбрали диафрагму меньшего размера, чтобы получить немного места для маневра в глубине резкости. Тем не менее, вам, вероятно, не понадобится много всего. Поиграйте с калькулятором глубины резкости для своего фокусного расстояния, определите разумный DOF, а затем выберите максимально возможную диафрагму. (Тем не менее, убедитесь, что для максимальной резкости вы находитесь на одной или двух ступенях под максимальной диафрагмой.) Вам нужна максимальная диафрагма, чтобы у вас было больше места для воспроизведения с затвором и ISO; Смотри ниже.

  3. Затвор: очевидно, вы хотите, чтобы это было как можно быстрее, чтобы уменьшить дрожание, но при этом получать достаточно света. Я слышал, что разные источники утверждают, что «выдержка равна фокусному расстоянию», чтобы избежать дрожания; некоторые требуют двойного Поэтому, если вы используете объектив 50 мм, попробуйте сохранить выдержку от 1/50 до 1/100. Как только вы это сделаете, попробуйте самую медленную скорость, чтобы максимизировать свет.

  4. ISO: вы должны быть в состоянии повысить это довольно высоко. Шум может уменьшить внешний вид картинки, но, вероятно, не сильно ухудшит ее читабельность. Что такое «высокий ISO» и «слишком шумно», зависит от вашей камеры. Эксперимент. Это, вероятно, лучший способ получить правильную экспозицию при слабом освещении по сравнению с диафрагмой и затвором.

  5. Баланс белого: для вас это не должно иметь большого значения. Если ваша сфотографированная бумага выглядит не совсем белой, имеет ли это значение? (Другая история, если вы фотографируете книги с полноцветными картинками, конечно). Если вы хотите исправить это в посте, у вас будет относительно легкое время, так как у вас есть много бумаги нейтрального цвета для работы. Я бы, наверное, оставил вашу камеру на Auto White Balance и забыл об этом.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.