Какие технические трудности стоят за созданием датчика с большим динамическим диапазоном, такого как человеческий глаз?


17

Почему у нас еще нет датчиков с высоким динамическим диапазоном, которые имеют правильную экспозицию в каждой части изображения?


2
Собственно после ответа я увидел, что это уже обсуждалось здесь . Если это не отвечает всем за вас, попробуйте расширить свой вопрос с более подробной информацией.
mivilar

Камера BlackMagic (full HD video) имеет EV 14, современные профессиональные видеокамеры (4K) имеют 18 EV. Итак, у нас есть эти датчики ...
TFuto

Ответы:


20

Уже есть камеры с DR больше человеческого глаза, как мгновенно, так и в целом. Динамический диапазон человеческого глаза не так велик, как думает большинство людей. Насколько я помню, это где-то около 12-16 электромобилей, что соответствует уровню современной DSLR.

Основное отличие состоит в том, что у нас есть чрезвычайно естественное управление диафрагмой, которое будет регулироваться для разных частей изображения. По сути, наш мозг автоматически создает для нас изображение. Когда мы смотрим на яркую часть сцены, наши зрачки сжимаются, и мы видим детали этой яркой части. Если мы переместим фокус на более темную часть, наши зрачки быстро откроются, и мы увидим детали темной части. Наш мозг знает, как выглядела предыдущая часть, и поэтому мы не замечаем изменений в нашем периферийном зрении, но на самом деле мы не видим столько деталей, на которых мы больше не фокусируемся.

Точно так же, даже для всего диапазона человеческого зрения существуют специализированные камеры, которые могут быть намного темнее, чем у нас, и, тем не менее, видеть, особенно цветные, в настоящее время они слишком дороги для широкой публики, поскольку для них требуются очень высококачественные материалы и конструкции, чтобы получить минимальный уровень шума. Есть также датчики, способные смотреть на очень яркие объекты, на которые людям было бы больно смотреть.


AJ, DSLR не имеют такой же динамический диапазон, как глаз. для DSLR - 2 на 14, для человеческого глаза - 10 на 14
Ромео Нинов

@RomeoNinov - не для мгновенного DR, только для очевидного. У вас есть источник для вашей претензии? Мой источник здесь - если бы мы вместо этого рассмотрели мгновенный динамический диапазон нашего глаза (где открытие зрачка не изменилось), тогда камеры работают намного лучше. Это было бы похоже на просмотр одной области внутри сцены, позволяя нашим глазам приспособиться, и больше нигде не глядя. В этом случае большинство оценивают, что наши глаза могут видеть где-нибудь с 10-14 f-ступеней динамического диапазона "
AJ Henderson

@RomeoNinov - чуть лучший ресурс . Поэтому стоит отметить, что наши глаза работают лучше, когда камеры работают плохо, но наши глаза хуже, когда камеры работают лучше. В тени у нас есть 20EV, где камеры уменьшают EV. По яркости у нас есть около 10EV, но у камер их полно от 12 до 14EV. 10 ^ 14 - это общий диапазон, который мы можем видеть, когда наши глаза приспосабливаются, а не то, что мы видим в любое время. И в этом отношении камеры также не ограничиваются 2 ^ 14.
AJ Henderson

да, камеры ограничены глубиной в битах вашего необработанного изображения. Вы не можете получить больше битов или больше информации из изображения. Я согласен с тем, что изображение мозга «вижу» не только из одного снимка глаза, более того, мы используем два глаза, которые добавляют много дополнительной информации к изображению в мозге. И на ресурсе, который вы упоминаете во втором комментарии, вы видите динамический диапазон глаза, отображаемый в степени 10. Это только подтверждает мои слова. Даже если DR только 12 EV, это 10 ^ 12, что составляет миллионы миллионов, по сравнению с 2 ^ 14, что составляет 16384
Ромео Нинов

1
Но даже датчик, строго ограниченный, скажем, шестизначным DR в любой момент времени, может быть использован для измерения деталей от очень темных до очень ярких значений в последовательных кадрах путем изменения Tv и Av! С точки зрения апертуры, это то, что делает система глаз / мозг.
Майкл C

10

Видеть - это активный процесс

Большой проблемой является то, что взгляд глазами очень не похож на захват изображения - изображение должно включать в себя всю информацию, на которую может смотреть зритель , но нормальное зрение - это активный процесс, который включает в себя движение глаз, перефокусировку и расширение зрачков в соответствии с на объекты, на которые мы смотрим. Таким образом, если вы хотите зафиксировать «то, что видит глаз», вам, по сути, нужно зафиксировать точку обзора со всеми настройками, которые глаз может использовать.

Ваш вопрос касается динамического диапазона, но та же проблема возникает с визуальной детализацией и фокусировкой. Для «жизненного эквивалента» требуется гораздо больше пикселей, чем может на самом деле захватить ваш глаз, поскольку разрешение глаза очень неравное, и хотя вы смотрите только на одно маленькое пятно с серединой сетчатки высокого разрешения, изображение нуждается в больше деталей доступно, так как вы будете двигать глазами. В фильмах нужно выбирать один фокус, в то время как человек может просматривать «одно изображение» с большей глубиной, быстро перефокусируя глаза и / или перемещая их для правильного бинокулярного зрения в различных предполагаемых диапазонах (например, глядя на поверхность окна или сквозь него). ), и т.д.

Частично решение заключается в том, что - используя одну камеру несколько раз быстро (или несколько камер) для захвата множества изображений с различными настройками и последующего их объединения, HDR является наиболее ярким примером - точно так же, как на наш взгляд, он активно выглядит в разных местах с разными «настройками», и только потом ваш мозг объединяет все это в связную картинку или фильм. Фактические «снимки», сделанные нашими глазами, уже хуже, чем у хороших камер, просто их умственное сочетание приятно.


1
+1 за вашу точку зрения о фокусе в кино. Это также связано с одной из основных причин, почему у многих людей возникают головные боли при просмотре 3D-фильмов. Глаз должен физически сфокусироваться на экране, но стереоскопическое изображение заставляет мозг думать, что некоторые части экрана ближе или дальше, чем они есть на самом деле, вызывая утомление глаз, когда вы пытаетесь смотреть прямо на них. Студии пытаются минимизировать это, отображая фокус сцены в одном и том же месте на левом и правом изображениях. Так что, если вам нравится смотреть на детали фона, не забудьте ибупрофен!
bcrist

Тот факт, что видение является активным процессом, является одной из причин того, что действительно хорошие художники могут создавать картины, которые выглядят лучше, чем простая фотография. Простая фотография будет захватывать все в сцене с одинаковыми характеристиками точки обзора, фокусировки, экспозиции и баланса белого, в то время как глаза человека, который фактически просматривал сцену, могут постоянно настраиваться, когда они смотрят на разные части. Художник, в отличие от камеры, может создать изображение, на котором каждая часть сцены выглядит так, как если бы он смотрел на человека, который действительно находился в этом месте.
суперкат

6

Ваш ментальный образ является продуктом не только сетчатки глаза, но и его взаимодействия со всеми другими компонентами, участвующими в зрении, включая ученика и, конечно, ваш мозг. То, что вам может показаться как «одно изображение», на самом деле является результатом скоростной корректировки и обработки информации, а не одним снимком.

Вы можете найти больше информации по этой теме здесь .


1

Вполне возможно сделать датчик освещенности с логарифмическими свойствами - такой датчик будет иметь невероятный динамический диапазон за счет ограниченного разрешения для конкретной экспозиции. Для получения обоих требуется АЦП высокого разрешения. Для КТ визуализации обычно используется 24-битная линейная - и затем берется логарифм после корректировки смещения для создания КТ-изображения.

Сенсор, который одновременно контролирует экспозицию (время интегрирования - думайте о скорости затвора), может работать лучше, и если вы разрешите изменения эффективности сбора света (например, число), вы получите еще большую гибкость.

Максимальный динамический диапазон обычно ограничен шумом считывания - при считывании накопленного заряда будет некоторая ошибка - по сравнению с самым большим сигналом, который может поддерживать электронное устройство. Как я уже сказал, в медицинской визуализации обычно используется 24 бита, а это лучше, чем 1 часть на 10 миллионов. Это гораздо более высокий динамический диапазон, чем сетчатка для данного воздействия. Но это обычно не используется в обычных камерах, потому что глаз не может оценить эти детали на изображении - и разрешение достигается за счет скорости.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.