Этот вопрос лежит в основе того, что такое статистика и как проводить хороший статистический анализ. Это поднимает много вопросов, некоторые из терминологии и другие из теории. Чтобы прояснить их, давайте начнем с обозначения неявного контекста вопроса и продолжим, чтобы определить ключевые термины «параметр», «свойство» и «оценщик». Ответы на несколько частей вопроса возникают по мере их обсуждения. Заключительный заключительный раздел суммирует ключевые идеи.
Государственные пространства
Распространенное статистическое использование "распределения", как в "нормальном распределении с PDF, пропорциональным "на самом деле является (серьезным) злоупотреблением английским, потому что, очевидно, это не одно распределение: это целое семейство распределений,параметризованныхсимволамиμиσ. Стандартные обозначения для это «пространство состояний»Ω,множествоехр( - 12( х - μ ) / σ)2) гИксμσΩраспределений. (Я здесь немного упрощаюсь ради изложения и буду продолжать упрощаться по мере нашего продвижения, оставаясь при этом максимально строгим.) Его роль заключается в определении возможных целей наших статистических процедур: когда мы что-то оцениваем, мы выбирая один (или иногда больше) элементов из .Ω
Иногда пространства состояний явно параметризованы, как в . В этом описании существует взаимно-однозначное соответствие между набором кортежей { ( μ , σ ) } в верхней полуплоскости и набором распределений, которые мы будем использовать для моделирования наших данных. Одно из значений такой параметризации состоит в том, что теперь мы можем конкретно ссылаться на распределения в Ω посредством упорядоченной пары действительных чисел.Ω = { N( μ , σ2) | µ ∈ R , σ> 0 }{ ( μ , σ) }Ω
В других случаях пространства состояний не являются явно параметризованными. Примером может служить множество всех унимодальных непрерывных распределений. Ниже мы рассмотрим вопрос о том, можно ли в любом случае найти адекватную параметризацию в таких случаях.
параметризация
Как правило, параметризация из , является соответствие (математическая функция ) из подмножества R д (с г конечна) , чтобы Ом . То есть он использует упорядоченные наборы d- кортежей для маркировки распределений. Но это не просто переписка: это должно быть "хорошо себя вести". Чтобы понять это, рассмотрим множество всех непрерывных распределений, чьи PDF-файлы имеют конечные ожидания. Это будет широко рассматриваться как «непараметрический» в том смысле, что любая «естественная» попытка параметризации этого набора будет включать счетную последовательность действительных чисел (используя разложение в любом ортогональном базисе). Тем не менее, потому что этот набор имеет мощность ℵΩрddΩd , который является мощность переАльса, должен существовать какойто один-к-однозначное соответствие между этими распределений и R . Как это ни парадоксально, казалось бы, это делаетпараметризованноепространство состояний соднимреальным параметром!ℵ1р
Парадокс разрешается, отмечая, что одно действительное число не может иметь «хороших» отношений с распределениями: когда мы меняем значение этого числа, распределение, которому оно соответствует, в некоторых случаях должно меняться радикальным образом. Мы исключаем такие «патологические» параметризации, требуя, чтобы распределения, соответствующие близким значениям их параметров, сами были «близки» друг к другу. Обсуждение подходящих определений «close» привело бы нас слишком далеко, но я надеюсь, что этого описания достаточно, чтобы продемонстрировать, что быть параметром гораздо больше, чем просто назвать конкретный дистрибутив.
Свойства распределений
Благодаря повторному применению мы привыкли думать о «свойстве» распределения как о некоторой понятной величине, которая часто появляется в нашей работе, такой как ее ожидание, дисперсия и так далее. Проблема с этим в качестве возможного определения «свойства» заключается в том, что оно слишком расплывчато и недостаточно обобщенно. (Именно здесь математика была в середине 18-го века, где «функции» рассматривались как конечные процессы, применяемые к объектам.) Вместо этого, единственное разумное определение «свойства», которое всегда будет работать, - думать о свойстве как о будучи числом, которое однозначно присваивается каждому распределению в Ω, Это включает в себя среднее значение, дисперсию, любой момент, любую алгебраическую комбинацию моментов, любой квантиль и многое другое, включая вещи, которые даже не могут быть вычислены. Однако, это не включает то , что не имело бы никакого смысла для некоторых из элементов . Например, если Ω состоит из всех распределений Стьюдента t, то среднее значение не является допустимым свойством для Ω (поскольку t 1 не имеет среднего значения). Это еще раз впечатляет нас, насколько наши идеи зависят от того, из чего действительно состоит Ω .ΩΩΩT1Ω
Свойства не всегда параметры
Свойство может быть настолько сложной функцией, что оно не будет служить параметром. Рассмотрим случай «нормального распределения». Возможно, мы захотим узнать, является ли среднее истинного распределения при округлении до ближайшего целого числа четным. Это собственность. Но это не будет служить параметром.
Параметры не обязательно являются свойствами
Когда параметры и распределения находятся в взаимно-однозначном соответствии, тогда, очевидно, любой параметр и любая функция параметров в этом отношении является свойством согласно нашему определению. Но не должно быть однозначного соответствия между параметрами и распределениями: иногда несколько распределений должны описываться двумя или более четко различающимися значениями параметров. Например, параметр местоположения для точек на сфере, естественно, будет использовать широту и долготу. Это нормально - за исключением двух полюсов, которые соответствуют заданной широте и любой действительной долготе. место(точка на сфере) действительно является свойством, но его долгота не обязательно является свойством. Хотя существуют различные уклоны (например, просто объявляется, что долгота полюса равна нулю), эта проблема подчеркивает важное концептуальное различие между свойством (которое уникально связано с распределением) и параметром (который является способом маркировки распределение и не может быть уникальным).
Статистические процедуры
Цель оценки называется оценкой . Это просто собственность. Статистик не может выбрать оценку: это область ее клиента. Когда кто-то приходит к вам с выборкой из популяции и просит вас оценить 99-й процентиль популяции, вы, скорее всего, упустите возможность дать оценку среднего значения вместо этого! Ваша задача как статистика состоит в том, чтобы определить хорошую процедуру для оценки оценки, которую вам дали. (Иногда ваша работа состоит в том, чтобы убедить вашего клиента, что он выбрал неправильную оценку для своих научных целей, но это другая проблема ...)
По определению, процедура - это способ получить число из данных. Процедуры обычно задаются в виде формул, которые должны применяться к данным, например, «сложить их все и разделить на их количество». Буквально любая процедура может быть объявлена «оценщиком» данной оценки. Например, я мог бы заявить, что выборочное среднее (формула, примененная к данным) оценивает дисперсию совокупности (свойство совокупности, предполагая , что наш клиент ограничил набор возможных совокупностей чтобы включить только те, которые фактически имеют отклонения).Ω
Оценщики
Оценщик не должен иметь никакой очевидной связи с оценкой. Например, вы видите какую-либо связь между выборочным средним и популяционной дисперсией? Я тоже. Но, тем не менее, выборочное среднее фактически является приличной оценкой дисперсии населенностей для некоторого Ω (например, множества всех распределений Пуассона). В этом заключается один из ключей к пониманию оценок: их качества зависят от множества возможных состояний . Но это только часть этого.Ω
Компетентный статистик захочет узнать, насколько хорошо будет выполнять рекомендованная ими процедура. Давайте назовем процедуру " " и пусть оценочная величина будет θ . Не зная, какое распределение на самом деле является истинным, она будет рассматривать выполнение процедуры для каждого возможного распределения F ∈ Ω . При наличии такой F и любых возможных результатов s (то есть набора данных) она будет сравнивать t ( s ).Tθ F∈ ΩFsт ( с ) (что оценивает ее процедура) с (значением оценки для F ). θ ( F)FЭто ее клиент обязан сказать ей, насколько близко или далеко друг от друга эти двое. (Это часто делается с помощью функции «потери».) Затем она может рассмотреть ожидание расстояния между и θ ( F ) . Это риск ее процедуры. Поскольку это зависит от F , риск является функцией, определенной на Ω .т ( с )θ ( F)FΩ
(Хорошо) статистики рекомендуют процедуры, основанные на сравнении рисков. Например, предположим, что для каждого риск процедуры tF∈ Ω меньше или равен риску t . Тогда нет никакой причины использовать t : это «недопустимо». В противном случае это «допустимо».T1TT
(«Байесовский» статистик всегда будет сравнивать риски путем усреднения по «предшествующему» распределению возможных состояний (обычно предоставляется клиентом). «Частый» статистик может сделать это, если такой предварительный случай оправданно существует, но он также готов сравнить риски другими способами, избегая байесовских.)
Выводы
Мы имеем право сказать , что любой , что является допустимым для & thetas является оценка из & thetas . Tθθ Мы должны в практических целях (поскольку допустимые процедуры найти сложно) согнуть это, говоря, что любой T который имеет приемлемо небольшой риск (по сравнению с ) среди практически осуществимых процедур, является оценкой θ . θθ «Приемлемо» и «практически осуществимо» определяются клиентом, конечно: «приемлемо» относится к их риску, а «практически осуществимо» отражает стоимость (в конечном итоге оплачиваемую ими) реализации процедуры.
В основе этого краткого определения лежат все только что обсужденные идеи: чтобы понять его, мы должны иметь в виду конкретное (которое являетсяΩ моделью исследуемой проблемы, процесса или совокупности), определенную оценку (предоставленную клиентом), специфическая функция потерь (которая количественно связывает с оценкой и также дается клиентом), идея риска (вычисляется статистиком), некоторая процедура для сравнения функций риска (ответственность статистика по согласованию с клиентом), и понимание того, какие процедуры на самом деле могут быть выполнены (проблема «практичности»), даже если ни одно из них явно не упомянуто в определении.T