Понимание компонентов Cb и Cr в цветовом пространстве YCbCr


11

Я знаком с аддитивным (RGB), субстративным (CMYK) и HSV-подобными цветовыми пространствами, но статья, которую я сейчас пытаюсь понять, работает с цветовым пространством YCbCr для сегментации изображения / определения объекта.

Я провёл большую часть утра в поисках чего-то, что могло бы объяснить YCbCr естественным образом, но я просто не понимаю. Я получил хороший, интуитивное объяснение общей идеи позади этого цветового пространства здесь , и объяснение того , как она используется для кодирования изображения / сжатия от этих ребят (все на photo.SE).

Формулы для расчета YCbCr из RGB легко доступны в Википедии .

Я получил мотивацию для этого представления, я понял, что Y-компонент содержит самую важную (для человеческого глаза) полутоновую информацию об изображении.

Я понял, что Cb и Cr несут информацию о цветах , и что (из-за чувствительности человеческого глаза (не)) они могут быть сжаты без видимой потери качества. Но что на самом деле представляет каждый из компонентов цветности?

Поскольку авторы статьи упоминают, что «информация о цветности имеет первостепенное значение в определении объектов» в их подходе, и я не могу полностью понять, что я читаю с моим текущим уровнем «Y - интенсивность, Cb и Cr как-то несут информацию о цвете» уровня понимание YCbCr.

Я ищу ответ в виде строки «Cb - это ..., а Cr - это ...» или «если вы представляете, просматривая / используя XY, вы на самом деле смотрите на компонент Cb ...», или другой способ, который помог бы мне понять информацию, передаваемую каждым из компонентов в отдельности, а не только то, что они вместе несут информацию о цвете.

РЕДАКТИРОВАТЬ

Позвольте мне привести примеры интуитивных объяснений для других цветовых пространств типа, который я ищу:

RGB : Как светить цветным фонариком на черной стене: если ты светишь синим фонариком, ты видишь синее отражение. Если вы добавите красный фонарик, он покажет пурпурное отражение, представляющее собой смесь синего и красного.

CMYK : Подобно смешиванию акварелей, вы «добавляете к цветам, которые отражает поверхность» (т.е. вычитаете цвет из фона), поэтому, если вы смешаете желтый с голубым, if будет отражать зеленый, и, таким образом, вы получите зеленый цвет.

ВПГ : Маленьких детей привлекают очень насыщенные объекты, а не яркие (ценность). Компонент Hue - это то, что «дает цвет», а низкая насыщенность означает, что цвет «разбавляется» белым. Изменение стоимости делает все это ярче или темнее.

Благодаря этим определениям я смог получить интуитивное представление о том, что означает цветовое представление в каждом цветовом пространстве, без запоминания диаграмм для каждого из них.

Ответы:


7

YUV (или YCbCr) похож на HSV, но в разных координатах. (Разница между YUV и YCbCr незначительна - в основном связана с точными формулами).

В(S,ЧАС)(U,В)ЧАСS

Uзнак равноSсоз(ЧАС)

Взнак равноSгрех(ЧАС)

Вы можете увидеть это ссылку для получения дополнительной информации.

Еще одна вещь, чтобы добавить в свой список интуиции:

Насыщенность - это насколько чистый цвет со спектральной точки зрения . Например, лазер имеет очень узкий спектр, что предполагает высокую насыщенность.


Вы можете добавить объяснение разницы между YUV и YCbCr, для полноты картины?
Пенелопа

@ Андрей Рубштейн, если лазер имеет высокую насыщенность, верно ли обратное? Другими словами, если я измеряю RGB и преобразовываю в HSV, означает ли высокая насыщенность, что она должна происходить из когерентного лазерного источника? Спасибо.
Франк

@ Франц, не обязательно лазер. Но трудно получить насыщенный цвет с широким спектром, поскольку чем он шире, тем сложнее получить высокий отклик только в одном компоненте.
Андрей Рубштейн

@ Андрей Рубштейн, спасибо за ответ. Мкс-единицы интенсивности насыщения - это энергия за единицу времени на единицу площади. , Единицы измерения энергии насыщения в мкс - это энергия на единицу площади. где твердотельные лазерные импульсы длинные, от 10 до 50 нс (наносекунд). Означает ли высокая насыщенность с очень узким спектром, что он должен исходить из когерентного лазерного источника?
Фрэнк

@ Андрей Рубшейн. Вы совершенно правы ... Я только что обнаружил, что светодиоды излучают свет, который в значительной степени монохроматичен, как и натриевые лампы низкого давления. Существуют ли отличительные характеристики когерентных лазерных указателей, которые можно использовать, чтобы отличать лазерные указатели от общего изображения, наблюдаемого через окно кабины самолета Boeing 737?
Франк

2

Не уверен, что вы подразумеваете под словом «на самом деле», поскольку ни RGB, ни YUV не представляют ни частоту фотонов, ни типичные реакции стержня / конуса человеческого глаза. Но вы можете увидеть, как они выглядят, синтезируя некоторые цветовые пятна YCrCb, такие как (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1) и т. Д.

Вот страница Википедии, которая включает диаграмму:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

ДОБАВЛЕНО: RGB и тому подобное были почти разработаны (или эволюционировали), чтобы соответствовать возможному интуитивному пониманию восприятия человеком (и названия цветов оказываются культурно изученными). YUV, напротив, спроектирован так, что шум в УФ-области (добавляемый к шумному поддиапазону NTSC) будет трудно увидеть и, следовательно, будет сложнее описать. YCrCb - это вариация одного и того же цветового отображения. Так что не ищите существующего «интуитивного» понимания, которое может не существовать. Возможно, создайте свой собственный, «изучив» диаграмму и построив некоторые совершенно новые нейронные связи, которые в данный момент могут не существовать в вашем мозгу (или что-то в этом роде).


Я добавил примеры для других цветовых пространств типа, который я хотел бы получить для YCbCr. Надеюсь, что это делает вид объяснения, которое я ищу, более ясным.
Пенелопа

0

Когда вы понимаете HSV / HSB, нетрудно понять YCbCr. Канал B в HSB соответствует цветности (chroma = saturation http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/). Вы можете взять изображение RGB и преобразовать его в оттенки серого или конвертировать каждый канал RGB в оттенки серого, и они объединят их в один канал. Для упрощения, давайте иметь пиксель со 100% красным, 100% зеленым и 70% синим. Вы рассчитаете среднее ... (100 + 100 + 70) / 3 и получите значение 90%, что означает 90% яркости. Так что в оттенках серого это очень светло-серый цвет. Теперь, если мы хотим выразить исходные цвета в канале с оттенками серого, нам понадобятся 3 формулы для каждого цвета (красный, зеленый, синий). Вы бы рассчитали разницу значений R против градаций серого, G против градаций серого и B против градаций серого. Для этого потребуется 4 канала (RGB + цветность). Но мы можем сделать то же самое с 3 каналами. Мы можем сделать небольшую коррекцию к зеленому каналу. Давайте посчитаем разницу с зеленым каналом. Оригинальный зеленый - это 100%, новое значение зеленого, преобразованное в серый, составляет 90%. Разница составляет -10%. Итак, давайте изменим R и B каналы этого пикселя на эту разницу. Мы только что сделали гамма-коррекцию или все каналы. Значения зеленого канала будут такими же, как для изображения в градациях серого. Поэтому мы больше не рассчитываем с зеленым каналом. Зеленый кодируется в канале цветности Y .... Остальные цвета (R, B) также настраиваются. R` = 90% от исходного или 100% от Y, потому что R и B равны в этом примере. Соединение B имеет разницу + 20% по отношению к оригиналу, но после того, как оно было изменено с помощью гамма-коррекции, оно имеет разницу + 30% по отношению к Y. Чтобы еще больше упростить это, это похоже на формулу, в которой вам нужно сделать сложение для всех трех соединений. Различия, которые вы получаете для красного и синего, это Cb и Cr. Персонажи просто говорят, что вы сравнили синий канал с каналом цветности и красный канал с каналом цветности. Следовательно, Cb и Cr.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.