Какова связь между оценщиком и оценкой?
Какова связь между оценщиком и оценкой?
Ответы:
Э. Л. Леманн в своей классической теории оценки точек отвечает на этот вопрос на стр. 1-2.
Наблюдения теперь постулируются как значения, взятые случайными переменными, которые, как предполагается, следуют совместному распределению вероятности , принадлежащему некоторому известному классу ...
... давайте теперь специализируемся на точечной оценке ... предположим, что является вещественнозначной функцией, определенной [для оговоренного класса распределений], и что мы хотели бы узнать значение g [при любом фактическом распределении в эффект, θ ]. К сожалению, θ и, следовательно, g ( θ ) неизвестны. Однако данные могут использоваться для получения оценки g ( θ ) , значения, которое, как можно надеяться, будет близко к g ( θ ) .
На словах: оценщик - это определенная математическая процедура, которая выдает число ( оценку ) для любого возможного набора данных, который может дать конкретная проблема. Это число предназначено для представления некоторого определенного числового свойства ( ) процесса генерации данных; мы могли бы назвать это «оценкой».
Сама оценка не является случайной величиной: это просто математическая функция. Однако оценка, которую он производит, основана на данных, которые сами моделируются как случайные величины. Это делает оценку (которая считается зависимой от данных) случайной величиной, и конкретная оценка для определенного набора данных становится реализацией этой случайной величины.
В одной (обычной) обычной методике наименьших квадратов данные состоят из упорядоченных пар . Х я была определена экспериментатором (они могут быть количества лекарственного средства , вводимого, например). Предполагается, что каждый y i (например, ответ на лекарство) исходит из распределения вероятностей, которое является нормальным, но с неизвестным средним значением µ i и общей дисперсией σ 2 . Кроме того, предполагается, что средства связаны с посредством формулы μ i = β 0 . Эти три параметра - σ , β 0 и β 1 - определяют базовое распределение y i для любого значения x i . Поэтомулюбоесвойство этого распределения можно рассматривать как функцию от ( σ , β 0 , β 1 ) . Примерами таких свойств являются пересечение β 0 , наклон β 1 , значение cos ( σ + β, или даже среднее значение при значенииx=2, которое (согласно этой формулировке) должно бытьβ0+2β1.
В этом контексте OLS не являющийся примером оценщик был бы процедурой, позволяющей угадать значение если x был установлен равным 2. Это не оценка, поскольку это значение y является случайным (каким-то образом полностью отделенным от случайность данных): это не (определенное числовое) свойство распределения, даже если оно связано с этим распределением. (Как мы только что видели, ожидание от для х = , равными & beta ; 0 + - β 1 , может быть оценен.)
В формулировке Лемана почти любая формула может быть оценкой практически любого свойства. Не существует внутренней математической связи между оценщиком и оценкой. Тем не менее, мы можем заранее оценить вероятность того, что оценщик будет достаточно близок к количеству, которое он намеревается оценить. Способы сделать это и как их использовать, являются предметом теории оценки.
Вкратце: оценщик - это функция, а оценка - это значение, которое суммирует наблюдаемую выборку.
Оценка является функцией , которая отображает случайную выборку для оценки параметра:
Заметимчто блок оценки изпслучайных величинХ1,Х2,. , , ,Хпявляется случайной величиной Θ . Например, оценка является выборочное среднее: ¯ Х =1
Может быть полезно проиллюстрировать ответ whuber в контексте модели линейной регрессии. Допустим, у вас есть некоторые двумерные данные, и вы используете Обыкновенные наименьшие квадраты для создания следующей модели:
Y = 6X + 1
На этом этапе вы можете принять любое значение X, вставить его в модель и предсказать результат, Y. В этом смысле вы можете рассматривать отдельные компоненты общей формы модели ( mX + B ) как оценщики . Образцы данных (которые вы предположительно включили в общую модель для расчета конкретных значений для m и B выше) предоставили основу, на которой вы могли бы получить оценки для m и B соответственно.
В соответствии с точками @ whuber в нашей теме ниже, какими бы ни были значения Y, для которых вы генерируете определенный набор оценок, в контексте линейной регрессии рассматриваются как прогнозируемые значения.
(отредактировано - несколько раз - чтобы отразить комментарии ниже)
Предположим, вы получили некоторые данные, и у вас была некоторая наблюдаемая переменная, называемая тета. Теперь ваши данные могут быть из распределения данных, для этого распределения есть соответствующее значение тета, которое вы выводите, которое является случайной величиной. Вы можете использовать MAP или среднее значение для расчета оценки этой случайной величины всякий раз, когда меняется распределение ваших данных. Таким образом, случайная величина тета известна как оценка , единственное значение ненаблюдаемой переменной для определенного типа данных.
В то время как оценщик ваших данных, который также является случайной величиной. Для разных типов распределений у вас есть разные типы данных, и поэтому у вас разные оценки, и, таким образом, эта соответствующая случайная величина называется оценщиком .