Вопрос
Дисперсия отрицательного биномиального (NB) распределения всегда больше его среднего значения. Когда среднее значение выборки превышает ее дисперсию, попытка подобрать параметры NB с максимальной вероятностью или с оценкой момента не удастся (решения с конечными параметрами не существует).
Однако возможно, что выборка, взятая из распределения NB, имеет среднее значение, превышающее дисперсию. Вот воспроизводимый пример в R.
set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576
Существует ненулевая вероятность того, что NB произведет выборку, для которой параметры не могут быть оценены (методами максимального правдоподобия и момента).
- Можно ли дать достойные оценки для этого образца?
- Что говорит теория оценки, когда оценки не определены для всех выборок?
Об ответе
Ответы @MarkRobinson и @Yves заставили меня понять, что параметризация является главной проблемой. Плотность вероятности НБ обычно записывается как
или как P(X=k)=Γ(r+k)
При первой параметризации оценка максимального правдоподобия равна всякий раз, когда дисперсия выборки меньше среднего, поэтому ничего полезного нельзя сказать о p . Под вторым это ( ∞ , ˉ x ) , поэтому мы можем дать разумную оценку m . Наконец, @MarkRobinson показывает, что мы можем решить проблему бесконечных значений, используя r вместор.
В заключение, в этой проблеме оценки нет ничего принципиально неправильного, за исключением того, что вы не всегда можете дать значимые интерпретации и p для каждой выборки. Честно говоря, идеи присутствуют в обоих ответах. Я выбрал @MarkRobinson как правильный для дополнений, которые он дает.