Недавно изучив начальную загрузку, у меня возник концептуальный вопрос, который до сих пор меня удивляет:
У вас есть население, и вы хотите знать атрибут населения, то есть , где я использую для представления населения. Это может означать, например, население. Обычно вы не можете получить все данные от населения. Таким образом, вы берете образец размера от населения. Предположим, у вас есть образец iid для простоты. Тогда вы получите оценку . Вы хотите использовать чтобы сделать выводы о , поэтому вы хотели бы знать, как изменяется .Р & thetas ; Х Н & thetas ; = г ( Х ) & thetas ; & thetas ; & thetas ;
Во-первых, существует истинное выборочное распределение . Концептуально, вы можете взять много образцов (каждый из них имеет размер ) из популяции. Каждый раз у вас будет реализация поскольку каждый раз у вас будет другой образец. Затем, в конце концов, вы сможете восстановить истинный дистрибутив . Хорошо, по крайней мере, это концептуальный эталон для оценки распределения . Позвольте мне повторить это: конечной целью является использование различных методов для оценки или аппроксимации истинного распределения . N θ =г(Х) ; & thetas ;
Теперь возникает вопрос. Обычно у вас есть только один образец который содержит точек данных. Затем вы будете многократно повторять выборку из этого примера, и вы получите загрузочный дистрибутив . Мой вопрос: насколько близко это распределение начальной загрузки к истинному выборочному распределению ? Есть ли способ определить это?Н θ