Беспристрастная взвешенная дисперсия уже рассматривалась здесь и в других местах, но, похоже, все еще существует удивительная путаница. Похоже, что существует консенсус в отношении формулы, представленной в первой ссылке, а также в статье Википедии . Это также выглядит как формула, используемая R, Mathematica и GSL (но не MATLAB). Тем не менее, статья Википедии также содержит следующую строку, которая выглядит как отличная проверка работоспособности для реализации взвешенной дисперсии:
Например, если значения {2,2,4,5,5,5} взяты из того же распределения, то мы можем рассматривать этот набор как невзвешенную выборку, или мы можем рассматривать его как взвешенную выборку {2,4, 5} с соответствующими весами {2,1,3}, и мы должны получить те же результаты.
Мои расчеты дают значение 2,1667 для дисперсии исходных значений и 2,9545 для взвешенной дисперсии. Должен ли я действительно ожидать, что они будут такими же? Почему или почему нет?