Аппроксимация для дискретного распределения


11

Каков наилучший способ аппроксимировать для двух заданных целых чисел когда вы знаете среднее , дисперсию , асимметрию и избыточный эксцесс дискретного распределения и из (ненулевых) мер формы и что нормальное приближение не подходит?Pr[nXm]m,nμσ2γ1γ2Xγ1γ2

Обычно я использовал бы нормальное приближение с целочисленной коррекцией ...

Pr[(n½)X(m+½)]=Pr[(n½)μσZ(m+½)μσ]=Φ((m+½)μσ)Φ((n½)μσ)

... если асимметрия и избыточный эксцесс были (ближе к) 0, но здесь это не так.

Я должен выполнить несколько приближений для разных дискретных распределений с разными значениями и . Поэтому мне интересно узнать, существует ли установленная процедура, которая использует и для выбора лучшего приближения, чем нормальное приближение.γ1γ2γ1γ2

Ответы:


4

Это интересный вопрос, который на самом деле не имеет хорошего решения. Есть несколько разных способов решения этой проблемы.

  1. Предположим базовое распределение и моменты совпадения - как предложено в ответах @ivant и @onestop. Недостатком является то, что многомерное обобщение может быть неясным.

  2. Седловые приближения. В этой статье:

    Гиллеспи К.С. и Реншоу Е. Улучшенное приближение седловой точки. Математическая бионаука , 2007.

    Мы смотрим на восстановление pdf / pmf, когда даны только первые несколько минут. Мы обнаружили, что этот подход работает, когда асимметрия не слишком велика.

  3. Расширения Лагерра:

    Мустафа, Х., Димитракопулоса, Р. Обобщенные разложения Лагерра многомерных плотностей вероятностей с моментами . Компьютеры и математика с приложениями , 2010.

    Результаты в этой статье кажутся более многообещающими, но я не кодировал их.


4

Подгонка распределения к данным с использованием первых четырех моментов - это как раз то, для чего Карл Пирсон разработал семейство непрерывных распределений вероятностей Пирсона (максимальная вероятность, конечно, гораздо более популярна в наши дни). Должно быть достаточно просто, чтобы соответствовать соответствующему члену этого семейства, затем использовать тот же тип коррекции непрерывности, который вы указали выше для нормального распределения.

Я полагаю, у вас должен быть действительно огромный размер выборки? В противном случае выборочные оценки асимметрии и особенно эксцесса часто бывают безнадежно неточными, а также очень чувствительными к выбросам. В любом случае, я настоятельно рекомендую вам взглянуть на L-моменты как альтернативу, которая имеет ряд преимуществ по сравнению с обычными моментами, которые могут быть выгодно для подгонки распределений к данным.


2

Вы можете попытаться использовать асимметричное нормальное распределение и посмотреть, достаточно ли избыточный эксцесс для ваших конкретных наборов данных близок к избыточному эксцессу распределения для данной асимметрии. Если это так, вы можете использовать асимметричное нормальное распределение cdf для оценки вероятности. Если нет, вам нужно было бы придумать преобразование в нормальный / асимметричный pdf, похожее на то, которое использовалось для асимметричного нормального распределения, которое дало бы вам возможность контролировать как асимметрию, так и избыточный эксцесс.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.