Бета-дистрибуция в Scipy


14

Согласно Википедии распределение бета-вероятности имеет два параметра формы: и β .αβ

Когда я звоню scipy.stats.beta.fit(x)в Python, где xнаходится ряд чисел в диапазоне , возвращаются 4 значения. Это кажется мне странным.[0,1]

После поиска в Google я обнаружил, что одно из возвращаемых значений должно быть 'location', поскольку третья переменная равна 0, если я вызываю scipy.stats.beta.fit(x, floc=0).

Кто-нибудь знает, что является четвертой переменной, и если первые две являются и β ?αβ


1
В документации называются последние два параметра "location" и "scale". Таким образом, четвертый параметр шкалы. Расположение и масштаб имеют стандартные статистические значения. Одна интерпретация в этом контексте дается явно в справочнике NIST .
whuber

У меня точно такая же проблема, но по какой-то причине все мои бета-модели имеют тенденцию "держать воду". Например, stats.beta.fit([60,61,62,72])я получаю (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982). Есть идеи, что я могу с этим сделать?
TheChymera

Просто добавьте эту документацию для общего метода подбора непрерывных случайных величин, который включает в себя несколько примеров с использованием beta.fit (): docs.scipy.org/doc/scipy/reference/generated/…
mathisfun

Ответы:


13

Несмотря на очевидное отсутствие документации по выводу beta.fit, он выводит в следующем порядке:

, β , loc (нижний предел), шкала (верхний предел - нижний предел)αβ


Это просто выплевывание нижнего и верхнего пределов в зависимости от диапазона данных или что-то еще?
shadowtalker

Пределы основаны на распределении вероятностей. то есть. Нормальное распределение не имеет ограничений, но выборочные данные редко превышают ~ +/-3. Бета-распределение имеет жесткие пределы с вероятностью 0 вне этих пределов. Вполне вероятно, что ваши данные не достигнут пределов, в зависимости от того, что вы моделируете. На самом деле, попытка заставить эти пределы соответствовать диапазону данных может быть проблематичной, так как многие бета-распределения имеют тенденцию к нулевой вероятности на этих границах. Смотрите этот пост для получения дополнительной информации по этому вопросу.
jdj081

1
Да, я в курсе. Эти пределы всегда равны 0 и 1. Следовательно: каковы верхние и нижние пределы, возвращаемые этой функцией, и как они вообще совпадают с «местоположением» и «масштабом»? Я думаю, я просто не понимаю этот ответ.
Shadowtalker

2
При определении бета-распределения эти пределы всегда равны 0 и 1. Но обобщенное бета-распределение включает в себя эти два коэффициента масштабирования. Данные, которые я моделирую, не попадают между 0 и 1, поэтому я должен использовать эти числа. Если ваши данные находятся в диапазоне от 0 до 1, то эти выходы должны быть очень близки к 0 и 1. Если вы знаете, что ваши пределы равны 0 и 1, вы можете принудительно установить их с помощью floc=0и fscale=1kwargs. Вы все равно получите эти результаты, но они будут идентичны тому, что вы заставляете их делать. И это, вероятно, изменит ваши альфа и бета значения.
jdj081
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.