Бета-дистрибуция в Scipy

Согласно Википедии распределение бета-вероятности имеет два параметра формы: и . $\alpha$ $\beta$

Когда я звоню scipy.stats.beta.fit(x)в Python, где xнаходится ряд чисел в диапазоне , возвращаются 4 значения. Это кажется мне странным. $[0,1]$

После поиска в Google я обнаружил, что одно из возвращаемых значений должно быть 'location', поскольку третья переменная равна 0, если я вызываю scipy.stats.beta.fit(x, floc=0).

Кто-нибудь знает, что является четвертой переменной, и если первые две являются и ? $\alpha$ $\beta$

python scipy beta-distribution

— Питер Смит
источник

В документации называются последние два параметра "location" и "scale". Таким образом, четвертый параметр шкалы. Расположение и масштаб имеют стандартные статистические значения. Одна интерпретация в этом контексте дается явно в справочнике NIST .

— whuber

У меня точно такая же проблема, но по какой-то причине все мои бета-модели имеют тенденцию "держать воду". Например, stats.beta.fit([60,61,62,72])я получаю (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982). Есть идеи, что я могу с этим сделать?

— TheChymera

Просто добавьте эту документацию для общего метода подбора непрерывных случайных величин, который включает в себя несколько примеров с использованием beta.fit (): docs.scipy.org/doc/scipy/reference/generated/…

— mathisfun

Несмотря на очевидное отсутствие документации по выводу beta.fit, он выводит в следующем порядке:

, , loc (нижний предел), шкала (верхний предел - нижний предел) $\alpha$ $\beta$

— jdj081
источник

Это просто выплевывание нижнего и верхнего пределов в зависимости от диапазона данных или что-то еще?

— shadowtalker

Пределы основаны на распределении вероятностей. то есть. Нормальное распределение не имеет ограничений, но выборочные данные редко превышают ~ +/-3. Бета-распределение имеет жесткие пределы с вероятностью 0 вне этих пределов. Вполне вероятно, что ваши данные не достигнут пределов, в зависимости от того, что вы моделируете. На самом деле, попытка заставить эти пределы соответствовать диапазону данных может быть проблематичной, так как многие бета-распределения имеют тенденцию к нулевой вероятности на этих границах. Смотрите этот пост для получения дополнительной информации по этому вопросу.

— jdj081

Да, я в курсе. Эти пределы всегда равны 0 и 1. Следовательно: каковы верхние и нижние пределы, возвращаемые этой функцией, и как они вообще совпадают с «местоположением» и «масштабом»? Я думаю, я просто не понимаю этот ответ.

— Shadowtalker

При определении бета-распределения эти пределы всегда равны 0 и 1. Но обобщенное бета-распределение включает в себя эти два коэффициента масштабирования. Данные, которые я моделирую, не попадают между 0 и 1, поэтому я должен использовать эти числа. Если ваши данные находятся в диапазоне от 0 до 1, то эти выходы должны быть очень близки к 0 и 1. Если вы знаете, что ваши пределы равны 0 и 1, вы можете принудительно установить их с помощью floc=0и fscale=1kwargs. Вы все равно получите эти результаты, но они будут идентичны тому, что вы заставляете их делать. И это, вероятно, изменит ваши альфа и бета значения.

— jdj081