Давайте обобщим, чтобы сосредоточиться на сути вопроса. Я изложу мельчайшие детали, чтобы не оставить никаких сомнений. Анализ требует только следующее:
Среднее арифметическое из набора чисел определяется какZ1, … , Zм
1м( з1+ ⋯ + zм) .
Ожидание является линейным оператором. То есть, когда являются случайными переменными и являются числами, то ожидание линейной комбинации является линейной комбинацией ожиданий,α iZя, я = 1 , … , мαя
E ( α1Z1+ ⋯ + αмZм) = α1E ( Z1) + ⋯ + αмE ( Zм) .
Пусть - выборка полученная из набора данных путем равномерного взятия элементов из с заменой. Пусть среднее арифметическое из . Это случайная величина. потом( B 1 , … , B k ) x = ( x 1 , … , x n ) k x m ( B ) BВ( Б1, … , БК)х = ( х1, … , ХN)КИксм ( б )В
E ( м ( B ) ) = E ( 1К( Б1+ ⋯ + BК) ) = 1К( E ( B1) + ⋯ + E ( BК) )
следует по линейности ожидания. Поскольку все элементы получены одинаковым образом, все они имеют одинаковое ожидание, говорят:bВб
E ( B1) = ⋯ = E ( BК) = б .
Это упрощает вышеизложенное
E ( м ( В ) ) = 1К( b + b + ⋯ + b ) = 1К( k b ) = b .
По определению ожидание представляет собой взвешенную по вероятности сумму значений. Поскольку предполагается, что каждое значение имеет равную вероятность выбора ,1 / nИкс1 / n
E (m(B))=b= E ( B)1) = 1NИкс1+ ⋯ + 1NИксN= 1N( х1+ ⋯ + xN) = х¯,
среднее арифметическое данных.
Чтобы ответить на вопрос, если кто-то использует среднее значение данных для оценки среднего значения популяции, то среднее значение начальной загрузки (в данном случае ) также равно и, следовательно, является идентичным в качестве оценки среднего значения популяции. , k=n ˉ xИкс¯k = nИкс¯
Для статистики, которая не является линейной функцией данных, один и тот же результат не обязательно имеет место. Однако было бы неправильно просто подставлять среднее значение начальной загрузки для значения статистики в данных: это не то, как работает начальная загрузка. Вместо этого, сравнивая среднее значение начальной загрузки со статистикой данных, мы получаем информацию о смещении статистики. Это можно использовать для корректировки исходной статистики, чтобы устранить смещение. Таким образом, исправленная смещением оценка, таким образом, становится алгебраической комбинацией исходной статистики и среднего значения начальной загрузки. Для получения дополнительной информации ищите «BCa» (скорректированная смещения и ускоренная начальная загрузка) и «ABC». Википедия предоставляет некоторые ссылки.