Зачем нам нужна самозагрузка?


16

В настоящее время я читаю «Все статистические данные» Ларри Вассермана и озадачен тем, что он написал в главе об оценке статистических функций непараметрических моделей.

Он написал

«Иногда мы можем найти оценочную стандартную ошибку статистической функции, выполнив некоторые вычисления. Однако в других случаях не очевидно, как оценить стандартную ошибку».

Я хотел бы отметить, что в следующей главе он говорит о начальной загрузке, чтобы решить эту проблему, но, поскольку я не совсем понимаю это утверждение, у меня нет полного стимула для начальной загрузки?

Какой пример, когда не очевидно, как оценить стандартную ошибку?

Все примеры, которые я видел до сих пор, были "очевидными", такими как затемX1,...Xn Ber(p)se^(p^n)=p^(1p^)/n


Ответы:


16

Два ответа.

  1. Что такое стандартная ошибка соотношения двух средних? Какая стандартная ошибка медианы? Что такое стандартная ошибка любой сложной статистики? Может быть, есть уравнение замкнутой формы, но возможно, что никто еще не разработал его.
  2. Чтобы использовать формулу для (скажем) стандартной ошибки среднего, мы должны сделать некоторые предположения. Если эти предположения нарушаются, мы не можем обязательно использовать метод. Как отмечает @Whuber в комментариях, самозагрузка позволяет нам ослабить некоторые из этих предположений и, следовательно, может предоставить более подходящие стандартные ошибки (хотя это может также сделать дополнительные предположения).

2
Ответ 1 - это хорошо, но ответ 2, похоже, задает вопрос, потому что при начальной загрузке тоже есть предположения. Я предполагаю, что суть может заключаться в том, что он обычно делает другие предположения, чем другие популярные процедуры, но это только мое предположение о том, что вы пытаетесь сказать, и я могу ошибаться.
whuber

@ Whuber - спасибо, я добавил немного разъяснений.
Джереми Майлз

5
Спасибо за правки. Но разве это не тот случай, когда при начальной загрузке обычно делаются другие предположения , а не на самом деле расслабляются некоторые? Например, предположения, необходимые для оценки SE среднего значения выборки, заключаются в том, что данные являются внутренними и исходное распределение имеет конечную дисперсию. В этом случае загрузчик фактически должен добавить допущения: он не работает, если размер выборки не «достаточно большой». Хотя это может показаться спорным из-за технических проблем, я пытаюсь рассмотреть общую картину: начальная загрузка не является панацеей и не всегда применима.
whuber

3
@JeremyMiles загрузчик не свободен от предположений. Необходимо убедиться, что распределение является ключевым для большинства расчетов ошибок при начальной загрузке, что часто может быть более сложным, чем получение согласованной оценки для стандартной ошибки. Кроме того, отношение средних значений имеет очень простую аппроксимацию ошибок, полученную из δ-метода. Поэтому я не думаю, что этот пример противоречит точке зрения ОП.
AdamO

9

Пример может помочь проиллюстрировать. Предположу, что в рамках причинного моделирования, вы заинтересованы в определении того , соотношение между (разоблачением интереса) Y (результат интереса) опосредуются переменной W . Это означает, что в двух регрессионных моделях:XYW

E[Y|X]=β0+β1XE[Y|X,W]=γ0+γ1X+γ2W

Эффект отличается от эффекта γ 1 .β1γ1

Y

Мы подходим к двум моделям: 1: поправка на курение и результат, а также другие факторы, такие как возраст, пол, доход и семейная история сердечных заболеваний, затем 2: все предыдущие ковариаты, а также индекс массы тела. Разница в эффекте курения между моделями 1 и 2 заключается в том, где мы основываем наш вывод.

H:β1=γ1K:β1γ1

T=β1γ1S=β1/γ1TSp


TSTS

TS

γ2=0

@whuber А, я вижу замешательство. Пожалуйста, ознакомьтесь с рекомендуемой статьей от MacKinnon здесь .
AdamO

TSTTT

2

Было бы желательно иметь параметрические решения для каждой статистической меры, но в то же время совершенно нереально. Bootstrap пригодится в этих случаях. Пример, который мне приходит в голову, касается разницы между двумя способами неравномерного распределения затрат. В этом случае классический t-критерий с двумя выборками не отвечает его теоретическим требованиям (распределения, из которых были взяты исследуемые образцы, безусловно, отклоняются от нормальности из-за их длинного правого хвоста), а непараметрические тесты не позволяют полезная информация для лиц, принимающих решения (которые обычно не заинтересованы в званиях). Одним из возможных решений, позволяющих избежать заикания в этом вопросе, является t-тест начальной загрузки с двумя примерами.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.