Являются ли противоречивые оценки когда-либо предпочтительными?


22

Согласованность, безусловно, является естественной и важной оценкой свойств, но существуют ли ситуации, когда может быть лучше использовать противоречивую оценку, а не последовательную?

Более конкретно, есть ли примеры противоречивой оценки, которая превосходит разумную непротиворечивую оценку для всех конечных (относительно некоторой подходящей функции потерь)?n


1
Существует интересный компромисс в производительности между согласованностью выбора модели и согласованностью параметров в задачах оценки с использованием лассо и его (многих!) Вариантов. Это подробно описано, например, в недавнем тексте Бюльмана и ван дер Гира.
кардинал

Разве аргумент в моем, теперь удаленном, ответе все еще остается в силе? А именно: в небольших выборках лучше иметь объективную оценку с низкой дисперсией. Или можно показать, что непротиворечивая оценка всегда имеет меньшую дисперсию, чем любая другая объективная оценка?
Боб Янсен

Возможно, @Bootvis! У вас есть пример противоречивой оценки с низким MSE?
MånsT

3
@ Bootvis: Если вам случится взглянуть на обширные комментарии к ответу на недавний вопрос, спрашивающий о согласованности и непредвзятости, вы увидите, что непротиворечивая оценка может иметь произвольно дикое поведение как дисперсии, так и смещения (даже одновременно!) , Это должно удалить все сомнения относительно вашего комментария.
кардинал

Я думал, что у меня есть одна из двух книг, но, видимо, я тоже ошибался в этом! Пример нигде не найти. @cardinal: звучит интересно, проверим
Боб Янсен

Ответы:


25

Этот ответ описывает реальную проблему, когда в естественной согласованной оценке преобладает (превосходящая по всем возможным значениям параметров для всех размеров выборки) противоречивая оценка. Это мотивируется идеей, что согласованность лучше всего подходит для квадратичных потерь, поэтому использование потерь, сильно отклоняющихся от этого (таких как асимметричные потери), должно сделать согласованность практически бесполезной при оценке эффективности оценщиков.


Предположим, ваш клиент желает оценить среднее значение переменной (предполагается, что она имеет симметричное распределение) из выборки iid , но они не склонны к (а) его недооценке или (б) чрезмерно завышению Это.(x1,,xn)

Чтобы увидеть, как это может сработать, давайте примем простую функцию потерь, понимая, что на практике потери могут отличаться от этой количественно (но не качественно). Выберите единицы измерения, чтобы был наибольшим допустимым завышением, и установите потерю оценки t, когда истинное среднее значение равно μ, равному 0, когда μ t μ1tμ0 и равному 1 в противном случае.μtμ+11

Расчеты особенно просты для нормального семейства распределений со средним и дисперсией σ 2 > 0 , тогда для выборочного среднего ˉ xμσ2>0имеет нормальное(μ,σ2/n)распределение. Среднее значение выборки является последовательной оценкойμ, как это хорошо известно (и очевидно). ЗаписьФдля стандартного нормального КОР, ожидаемая потеря выборочного среднего равна1/2x¯=1nixi(μ,σ2/n)μΦ:1/21/2+Φ(n/σ)1/2 происходит от 50% вероятности того, что выборочное среднее будет недооценить истинное среднее и возникает из-за вероятности переоценки истинного среднего значения более чем на1.Φ(n/σ)1

потери

Ожидаемая потеря равна синей области под этим стандартным нормальным PDF. Красная область показывает ожидаемую потерю альтернативной оценки ниже. Они отличаются, заменяя сплошную синюю область между - x¯и0по меньшей сплошной красной области междуn/(2σ)0иn/(2σ). Эта разница растет сростомn.n/σn

x¯+1/22Φ(n/(2σ))1/20nnμ+1/2μ

Функции потери

x¯x¯+1/2n .


2
L2L2

5
@Macro Мышление несколько косвенное и не предназначено для строгости, но я считаю, что это естественно: квадратичная потеря подразумевает минимизацию дисперсии, которая (через Чебышева) приводит к сходимости по вероятности. Следовательно, эвристика для нахождения контрпримера должна быть сосредоточена на потерях, которые настолько далеки от квадратичных, что такие манипуляции оказываются безуспешными.
whuber

1
1/20n

3
@ Майкл Хорошо, спасибо, что объяснили это. В этом контексте при неквадратичной потере «преимущество» не выражается смещением. Кто-то может критиковать эту функцию потерь, но я не хочу полностью ее отвергать: она моделирует ситуации, когда, например, данные представляют собой измерения изделия, изготовленного с определенными допусками, и это будет иметь катастрофические последствия (как в случае отказа уплотнительного кольца Shuttle). или банкротство бизнеса катастрофически) для истинного средства выйти за пределы этих допусков.
whuber

1
(+1) Отличный ответ, @whuber! Мне особенно нравится, что это не кажется слишком патологическим - я могу вспомнить множество ситуаций, в которых этот тип потери был бы применим.
MånsT
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.