@cardinal дал отличный ответ (+1), но вся проблема остается загадочной, если только вы не знакомы с доказательствами (а я нет). Поэтому я думаю, что остается вопрос относительно того, что является интуитивной причиной того, что парадокс Стейна не появляется в и .RR2
Я нахожу очень полезным регрессионную перспективу, предложенную в Стивене Стиглере, 1990, «Галтонианская перспектива оценки усадки» . Рассмотрим независимые измерения , каждый из которых измеряет некоторый базовый (ненаблюдаемый) и выбирается из . Если бы мы каким-то образом знали , мы могли бы составить график из пар:XiθiN(θi,1)θi(Xi,θi)
Диагональная линия соответствует нулевому шуму и совершенной оценке; на самом деле шум не равен нулю, и поэтому точки смещены от диагональной линии в горизонтальном направлении . Соответственно, можно рассматривать как линию регрессии на . Однако мы знаем и хотим оценить , поэтому нам лучше рассмотреть линию регрессии на - которая будет иметь другой наклон, смещенный по горизонтали , как показано на рисунке (пунктирная линия).θ=Xθ=XXθXθθX
Цитата из статьи Стиглера:
Этот галтоновский взгляд на парадокс Штейна делает его почти прозрачным. «Обычные» оценки выводятся из теоретической линии регрессии на . Эта строка была бы полезна, если бы нашей целью было предсказать из , но наша проблема обратная, а именно предсказать из используя сумму квадратов ошибок как критерий. Для этого критерия оптимальные линейные оценки задаются линией регрессии наименьших квадратов наθ^0i=XiXθXθθX∑(θi−θ^i)2θXи оценки Джеймса-Стейна и Эфрона-Морриса сами являются оценками этого оптимального линейного оценивания. «Обычные» оценки получены из неправильной линии регрессии, оценки Джеймса-Стейна и Эфрона-Морриса получены из приближений к правой линии регрессии.
И теперь наступает решающий момент (акцент добавлен):
Мы даже можем понять, почему необходимо: если или , линия наименьших квадратов на должна проходить через точки , и, следовательно, для или , две линии регрессии ( на и на ) должны совпадать в каждом .k≥3k=12θX(Xi,θi)k=12XθθXXi
Я думаю, что это очень ясно показывает, что особенного в и .k=1k=2