Для любых чисел со средним значением
, дисперсия определяется как
Применение к данному набору из чисел
которые для удобства изложения мы берем среднее значение , имеем
y 1 , y 2 , … , y N ˉ y = 1NY1, у2, ... , уN σ 2Y¯= 1NΣя = 1NYя(1)пх1,х2,...хпˉх=0σ2=1
σ2σ2= 1N- 1Σя = 1N( уя- у¯)2= 1N- 1Σя = 1N( у2я- 2 гяY¯+ у¯2)= 1N- 1[ ( ∑я = 1NY2я) -2Н( у¯)2+ N( у¯)2]= 1N- 1Σя = 1N( у2я- ( у¯)2)(1)
( 1 )NИкс1, х2, ... хNИкс¯= 0 xn+11σ2= 1n - 1Σя = 1N( х2я- ( х¯)2) = 1n - 1Σя = 1NИкс2я
Если теперь мы добавим новое наблюдение к этому набору данных, то новое среднее значение этого набора данных будет
то время как новая дисперсия
Soдолжен быть больше чем
Иксn + 1σ 21n + 1Σя = 1n + 1Икся= n x¯+ хn + 1n + 1= хn + 1n + 1
| хн+1| σ√σ^2= 1NΣя = 1n + 1( х2я- х2n + 1( n + 1 )2)= 1N[ ( ( n - 1 ) σ2+ х2n + 1) - х2n + 1n + 1]знак равно1N[ (n-1) σ2+ nn + 1Икс2n + 1]> σ2 только если х 2n + 1> n + 1Nσ2,
| Иксn + 1| xn+1ˉxσ√σ1 + 1N-----√
или, в более общем смысле, должен отличаться от среднего значения исходных данных, установленного более чем на , чтобы расширенный набор данных имел большую дисперсию, чем исходный набор данных. См. Также ответ Рэя Купмана, в котором указано, что новая дисперсия больше, равна или меньше, чем исходная дисперсия в соответствии с
отличается от среднего более, чем точно, или меньше, чем .
Иксn + 1x¯ xn+1σ√σ1+1n−−−−−√xn+1σ1+1n−−−−−√