Я пытаюсь изучать статистику, потому что я нахожу, что она настолько распространена, что запрещает мне изучать некоторые вещи, если я не понимаю ее должным образом. У меня возникли проблемы с пониманием этого понятия выборочного распределения средних значений. Я не могу понять, как некоторые книги и сайты объясняют это. Я думаю, что у меня есть понимание, но я не уверен, правильно ли это. Ниже моя попытка понять это.
Когда мы говорим о каком-то явлении, имеющем нормальное распределение, оно обычно (не всегда) касается населения.
Мы хотим использовать логическую статистику, чтобы предсказать некоторые данные о населении, но не располагаем всеми данными. Мы используем случайную выборку, и каждая выборка размера n одинаково вероятна для выбора.
Итак, мы берем много выборок, скажем, 100, и тогда распределение средних значений этих выборок будет приблизительно нормальным согласно центральной предельной теореме. Среднее значение выборочных средних будет приблизительно соответствовать среднему значению для населения.
Что я не понимаю, так это то, что вы часто видите «выборку из 100 человек…». Разве нам не нужны 10 или 100 выборок из 100 человек для приблизительной оценки среднего значения? Или это тот случай, когда мы можем взять одну достаточно большую выборку, скажем 1000, а затем сказать, что среднее будет приблизительно соответствовать среднему значению для населения? ИЛИ мы берем выборку из 1000 человек, а затем отбираем 100 случайных выборок по 100 человек в каждой выборке из той исходной 1000 человек, которую мы взяли, и затем используем это как наше приближение?
Всегда ли достаточно большой выборки, чтобы приблизить среднее значение (почти)? Должно ли население быть нормальным, чтобы это работало?