Являются ли оценки Байеса невосприимчивыми к смещению отбора?
В большинстве работ, в которых обсуждаются оценки в высоком измерении, например, данные о последовательности всего генома, часто возникает проблема смещения отбора. Смещение выбора обусловлено тем фактом, что, хотя у нас есть тысячи потенциальных предикторов, будет выбрано лишь немногие, и для избранных будет сделан вывод. Таким образом, процесс состоит из двух этапов: (1) выбрать подмножество предикторов (2) выполнить вывод на выбранных наборах, например, оценить коэффициенты шансов. Давид в своей парадоксальной статье 1994 года сосредоточился на объективных оценках и оценках Байеса. Он упрощает задачу выбора самого большого эффекта, который может быть эффектом лечения. Затем он говорит, что объективные оценки влияют на предвзятость выбора. Он использовал пример: предположим, что затем каждый
Но тревожное заявление, которое делают Давид, Эфрон и другие авторы, заключается в том, что оценщики Байеса неуязвимы для предвзятости выбора. Если я теперь поставлю перед , скажем, , оценка Байеса для определяется как где , с стандартным гауссовским.δ i ∼ g ( . ) δ i E { δ i ∣ Z i } = z i + dм(гя)=∫ф(гя-δя)г(δя)dδяф(.)
Если мы определим новый оценщик как все , что вам выбрать для оценки с , будет тем же если выбор был основан на Это следует из того, что является монотонным в . Мы также знаем, что сокращает до нуля с помощью термина γ 2 ( Z ) = max { E { δ 1 ∣ Z 1 } , E { δ 2 ∣ Z 2 } , … , E { δ N ∣ Z N } } , i δ i max γ 1 ( Z ) i γ 2 ( Z ) γ 2 ( Z )