На самом деле ни одно из объяснений не является правильным.
Доверительный эллипс имеет отношение к ненаблюдаемым параметрам популяции , таким как истинное среднее значение популяции в двумерном распределении. Эллипс с доверительной вероятностью 95% для этого среднего значения на самом деле представляет собой алгоритм со следующим свойством: если бы вам пришлось многократно повторять выборку из базового распределения и каждый раз вычислять доверительный эллипс, то 95% построенных таким образом эллипсов содержали бы базовую диаграмму. жадный. (Обратите внимание, что каждый образец, конечно, даст свой эллипс.)
Таким образом, доверительный эллипс обычно не содержит 95% наблюдений. Фактически, по мере увеличения количества наблюдений среднее значение будет лучше и лучше оцениваться, что приведет к все меньшим и меньшим доверительным эллипсам, которые, в свою очередь, содержат все меньшую долю фактических данных. (К сожалению, некоторые люди вычисляют наименьший эллипс, который содержит 95% их данных, напоминающих квантиль, что само по себе вполне нормально ... но затем продолжают называть этот «квантильный эллипс» «доверительным эллипсом», который, как видите, приводит в замешательство.)
Дисперсия основной популяции относится к эллипсу доверия. Высокая дисперсия будет означать, что данные расположены повсеместно, поэтому среднее значение не очень хорошо оценено, поэтому эллипс достоверности будет больше, чем если бы дисперсия была меньше.
Конечно, мы можем рассчитать доверительные эллипсы также для любого другого параметра популяции, который мы можем пожелать оценить. Или мы могли бы взглянуть на другие доверительные области, кроме эллипсов, особенно если мы не знаем, что предполагаемый параметр (асимптотически) нормально распределен.
Одномерным аналогом доверительного эллипса является доверительный интервал , и полезно просмотреть предыдущие вопросы в этом теге. Наш текущий вопрос с наибольшим количеством голосов в этом теге особенно хорош: почему 95% -й доверительный интервал не подразумевает 95-процентную вероятность сдерживания среднего значения? Большая часть дискуссии там также справедлива для многомерных аналогов одномерного доверительного интервала.