Изучать дисперсию сложно.
Во многих случаях требуется (возможно удивительно) большое количество выборок, чтобы хорошо оценить дисперсию. Ниже я покажу разработку для «канонического» случая нормального образца iid.
Предположим, что , являются независимыми случайными величинами. Мы ищем доверительный интервал для дисперсии, такой, что ширина интервала равна , т.е. ширина равна от точечной оценки. Например, если , то ширина CI равна половине значения точечной оценки, например, если , тогда CI будет что-то вроде , с шириной 5. Обратите внимание на асимметрию вокруг точечной оценки. ( - объективная оценка дисперсии.) я = 1 , ... , п N ( μ , сг 2 ) 100 ( 1 - & alpha ; ) % ρ s 2 100 ρ % ρ = 1 / 2 с 2 = 10 ( 8 ,Yяя = 1 , … , нN( μ , σ2)100 ( 1 - α ) %ρ s2100 ρ %ρ=1/2s2=10с 2(8,13)s2
«(Скорее,« а ») доверительный интервал для равен
где - это квантиль распределения хи-квадрат с степенями свободы. (Это вытекает из того факта, что является основной величиной в гауссовой установке.)( n - 1 ) s 2s2х 2
(n−1)s2χ2(1−α/2)(n−1)≤σ2≤(n−1)s2χ2(α/2)(n−1),
βn-1(n-1)s2/σ2χ2β(n−1)βn−1(n−1)s2/σ2
Мы хотим минимизировать ширину, чтобы
поэтому нам осталось решить для , чтобы
n ( n - 1 ) ( 1
L(n)=(n−1)s2χ2(α/2)(n−1)−(n−1)s2χ2(1−α/2)(n−1)<ρs2,
n(n−1)⎛⎝⎜1χ2(α/2)(n−1)−1χ2(1−α/2)(n−1)⎞⎠⎟<ρ.
Для случая доверительного интервала 99% мы получаем для и для . Этот последний случай дает интервал, который ( все еще! ) На 10% больше, чем точечная оценка дисперсии.n=65ρ=1n=5321ρ=0.1
Если выбранный вами уровень достоверности составляет менее 99%, то такой же интервал ширины будет получен для меньшего значения . Но может все еще быть больше, чем вы могли бы предположить.nn
Участок образца размером по сравнению с пропорциональной шириной шоу что - то , что выглядит асимптотически линейные на логарифмическом масштабе; другими словами, отношения, подобные степенному закону. Мы можем оценить силу этих степенных отношений (грубо) какnρ
α^≈log0.1−log1log5321−log65=−log10log523165≈−0.525,
что, к сожалению, решительно медленно!
Это своего рода «канонический» случай, чтобы дать вам представление о том, как проводить вычисления. Исходя из ваших графиков, ваши данные не выглядят особенно нормальными; в частности, есть то, что кажется заметным перекосом.
Но это должно дать вам примерное представление о том, чего ожидать. Обратите внимание, что для ответа на ваш второй вопрос, приведенный выше, необходимо сначала установить некоторый уровень доверия, который я установил на уровне 99% в приведенной выше разработке для демонстрационных целей.