Является ли выборка в некотором смысле «наилучшей» оценкой распределения?


10

По (слабому / сильному) закону больших чисел, учитывая некоторые точки выборки iid распределения, их выборка означает сходится к среднему значению распределения как по вероятности, так и как размер выборки уходит в бесконечность.{xiRn,i=1,,N}f({xi,i=1,,N}):=1Ni=1NxiN

Когда размер выборки N фиксирован, мне интересно, является ли оценка LLN f оценкой в ​​некотором смысле лучшей? Например,

  1. его ожидание - это среднее значение распределения, поэтому оно является объективной оценкой. Его дисперсия σ2N где σ2 - дисперсия распределения. Но это УМВУ?
  2. есть ли какая-нибудь функция L0:рN×рN[0,) такая, что е*({Икся,язнак равно1,...,N}) решить проблему минимизации:

    е*({Икся,язнак равно1,...,N})знак равноargminUрNΣязнак равно1NL0(Икся,U)?

    Другими словами, е* является наилучшей функцией контраста L0 в рамках минимальной контрастности (см. Раздел 2.1 «Базовые эвристики оценки» в « Математической статистике: основные идеи и избранные темы, том 1 » Бикла и Доксума).

    Например, если известно, что распределение ограничено из семейства гауссовых распределений, то среднее значение выборки будет оценкой MLE среднего распределения, а MLE относится к минимальному контрастному каркасу, а его функция контрастности L0 минус логарифмическая вероятность функция.

  3. есть ли некоторая функция такая, что решает проблему минимизации: для любого распределения из в некотором семействе распределений?f f = argmin fL:рN×F[0,)е*P x i F

    е*знак равноargminеЕн.о.р. {Икся,язнак равно1,...,N} каждый с распределением пL(е({Икся,язнак равно1,...,N}),п)?
    пИксяF

    Другими словами, является лучшим по отношению к некоторой потерянной функции и некоторому семейству распределений в теоретической структуре решения (см. Раздел 1.3 «Теоретическая структура решения» в « Математической статистике: основные идеи и отдельные темы, том 1 »). Bickle и Doksum). l Fе*LF

Обратите внимание, что выше приведены три разные интерпретации для «наилучшей» оценки, которую я знаю до сих пор. Если вы знаете о других возможных интерпретациях, которые могут относиться к оценщику LLN, пожалуйста, не стесняйтесь упомянуть об этом.


Другой способ охарактеризовать оценщик: пожалуйста, прочитайте о согласованном оценщике здесь . Среднее значение образца соответствует LLN.
Рохит Банга

1
Выборочное среднее имеет много хороших и интересных свойств, но иногда они не являются лучшими, которые можно иметь в конкретной ситуации. Одним из примеров являются случаи, когда поддержка распределения зависит от значения параметра. Рассмотрим , тогда - объективная оценка среднее значение распределения но это не UMVUE, например, несмещенные оценки, основанные на статистике наибольшего порядка будут иметь меньшую дисперсию, чем среднее значение выборки. 1Икс1,Икс2,...,ИксN~U(0,θ)θn+11NΣязнак равно1NИксяθN+1NИкс(N)
VitalStatistix

Спасибо! Но как вычисляется его дисперсия?
Тим

PDF с , наибольшая статистика по порядку определяется как , поэтому дисперсия несмещенной оценки будет иметь вид , т. е. дисперсия имеет порядок , по сравнению с дисперсией выборочного среднего, порядка . f ( y ) = n y n - 1Y=X(n)n
f(y)=nyn1θn;y(0,θ)
Var(nnn+1Y1Вaр(NN+1Y)знак равно1N(N+2)θ2 11N21N
VitalStatistix

@VitalStatistix, я что-то здесь упускаю? Если переменные равны их среднее значение по выборке имеет ожидание , поэтому не хотите ли вы умножить на 2, чтобы получить несмещенную оценку ? θ / 2 θ[0,θ]θ/2θ
NRH

Ответы:


4

Ответ на ваш второй вопрос - да: выборочное среднее значение - это минимальная оценка контрастности, когда ваша функция равна , когда x и u являются действительными числами, или , когда x и u равны векторы столбцов. Это следует из теории наименьших квадратов или дифференциального исчисления. L0(Икс-U)2(Икс-U)'(Икс-U)

Минимальная оценка контрастности при определенных технических условиях является как последовательной, так и асимптотически нормальной. Для выборочного среднего это уже следует из LLN и центральной предельной теоремы. Я не знаю, что минимальные оценки контрастности "оптимальны" в любом случае. Что приятно в оценках минимального контраста, так это то, что многие надежные оценки (например, медиана, оценки Хубера, выборочные квантили) попадают в это семейство, и мы можем сделать вывод, что они согласованы и асимптотически нормальны, просто применяя общую теорему для оценок минимального контраста, поэтому Пока мы проверяем некоторые технические условия (хотя часто это гораздо сложнее, чем кажется).

Одним из понятий оптимальности, которое вы не упоминаете в своем вопросе, является эффективность, которая, грубо говоря, касается того, насколько большой выборки вам нужно получить оценку определенного качества. См. Http://en.wikipedia.org/wiki/Efficiency_(statistics)#Asymptotic_efficiency для сравнения эффективности среднего значения и медианы (среднее значение более эффективно, но медиана более устойчива к выбросам).

Что касается третьего вопроса, без каких-либо ограничений на набор функций f, по которым вы находите argmin, я не думаю, что выборочное среднее будет оптимальным. Для любого распределения P вы можете установить f как постоянную, которая игнорирует и минимизирует потери для конкретного P. Среднее значение выборки не может справиться с этим.Икся

Минимаксная оптимальность является более слабым условием, чем заданное вами: вместо того, чтобы спрашивать, чтобы была лучшей функцией для любого в классе, вы можете попросить, чтобы имела лучшую производительность в худшем случае. То есть, между аргументом argmin и ожиданием, поместите в . Байесовский оптимальность другой подход: поставить априорное распределение на , и взять на себя ожидание над , а также пробы из .е*пе*МаксимумпFпFпп


Спасибо! Есть ли хорошие ссылки на свойства оценки минимального контраста, такие как непротиворечивые и асимптотически нормальные, а также примеры, такие как медиана, оценки Хубера, квантили образцов?
Тим

В разделе 5.2.2 книги Bickel & Doksum, которую вы цитируете, есть теорема о непротиворечивости оценок минимального контраста. В разделе 5.4.2 обсуждается асимптотическая нормальность. Другой источник, который я рекомендую и который обсуждает другие оценщики, о которых я упоминаю, это книга Асимптотической статистики Ван дер Ваарта . Глава 5 посвящена М-оценщикам, так его называют минимальными оценщиками контраста.
DavidR

Спасибо! Является ли норма в вашем первом абзаце произвольной для или это должна быть норма ? рNL2
Тим

Я имею в виду стандартную евклидову норму - для ясности я изменил ее на векторную запись.
DavidR

DavidR, спасибо! (1) Что касается части 3 в моем посте, мне интересно, может ли выборочное среднее, то есть LLN-оценка, вписаться в теоретическую основу решения для некоторой функции потерь ? (2) У меня сложилось впечатление, что все оценки, такие как MLE и метод оценки наименьших квадратов, соответствуют минимальной контрастной структуре, но не теоретической структуре решения. Так разве теоретическая основа решения не используется для построения оценщиков, а только для их оценки? L
Тим
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.