Это вещь, которая может быть трудно понять:
- если в среднем 95% всех доверительных интервалов будет содержать параметр
- и у меня есть один определенный доверительный интервал
- почему не вероятность того, что этот интервал содержит параметр также 95%?
Доверительный интервал относится к процедуре отбора проб. Если вы возьмете много выборок и рассчитаете 95% доверительный интервал для каждой выборки, вы обнаружите, что 95% этих интервалов содержат среднее значение по совокупности.
Это полезно, например, для отделов промышленного качества. Эти ребята берут много образцов, и теперь у них есть уверенность, что большинство их оценок будут довольно близки к реальности. Они знают, что 95% их оценок довольно хороши, но они не могут сказать это о каждой конкретной оценке.
Сравните это с бросающими кубиками: если бы вы бросили 600 (справедливых) кубиков, сколько бы 6 бросили? Ваше лучшее предположение - * 600 = 100.16
Однако, если вы бросили ОДИН кубик, бесполезно говорить: «С вероятностью 1/6 или 16,6% я теперь бросил 6». Почему? Потому что кубик показывает либо 6, либо какую-то другую фигуру. Вы бросили 6 или нет. Таким образом, вероятность равна 1 или 0. Вероятность не может быть .16
На вопрос перед броском, какова вероятность броска 6 с ОДНЫМ кубиком, байесовец ответил бы " " (основываясь на предварительной информации: все знают, что у кубика есть 6 сторон и равный шанс падать на кого-либо из них), но Frequentist сказал бы «Не знаю», потому что частота основана исключительно на данных, а не на априорных или какой-либо внешней информации.16
Аналогичным образом, если у вас есть только 1 выборка (таким образом, 1 доверительный интервал), вы не сможете сказать, насколько вероятно, что среднее значение популяции находится в этом интервале. Среднее (или любой параметр) либо в нем, либо нет. Вероятность равна либо 1, либо 0.
Кроме того, неверно, что значения в пределах доверительного интервала более вероятны, чем значения за пределами этого. Я сделал небольшую иллюстрацию; все измеряется в ° C. Помните, что вода замерзает при 0 ° C и кипит при 100 ° C.
Случай: в холодном озере мы бы хотели оценить температуру воды, которая течет ниже льда. Мы измеряем температуру в 100 местах. Вот мои данные:
- 0,1 ° C (измерено в 49 местах);
- 0,2 ° C (также в 49 местах);
- 0 ° C (в 1 месте. Это была вода, которая вот- вот замерзнет);
- 95 ° C (в одном месте есть фабрика, которая незаконно сбрасывает очень горячую воду в озеро).
- Средняя температура: 1,1 ° С;
- Стандартное отклонение: 1,5 ° С;
- 95% -CI: (-0,8 ° C ...... + 3,0 ° C).
Температуры в этом доверительном интервале определенно НЕ более вероятны, чем вне его. Средняя температура текущей воды в этом озере не может быть ниже 0 ° C, иначе это будет не вода, а лед. Часть этого доверительного интервала (а именно, секция от -0,8 до 0) на самом деле имеет 0% вероятности содержания истинного параметра.
В заключение: доверительные интервалы являются частым понятием, и поэтому основаны на идее повторных выборок. Если многие исследователи будут брать образцы из этого озера, и если все эти исследователи будут рассчитывать доверительные интервалы, то 95% этих интервалов будут содержать истинный параметр. Но для одного доверительного интервала невозможно сказать, насколько вероятно, что он содержит истинный параметр.