У меня есть некоторые данные в [0,1], которые я хотел бы проанализировать с помощью бета-регрессии. Конечно, что-то нужно сделать, чтобы приспособить значения 0,1. Мне не нравится изменять данные, чтобы соответствовать модели. Кроме того, я не верю, что нулевая и 1 инфляция - это хорошая идея, потому что я считаю, что в этом случае следует рассматривать 0 как очень маленькие положительные значения (но я не хочу точно сказать, какое значение является подходящим. Разумный выбор Я полагаю, что стоит выбрать небольшие значения, такие как .001 и .999, и подогнать модель, используя совокупный dist для бета-версии. Поэтому для наблюдений y_i логарифмическая вероятность LL_i будет
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
Что мне нравится в этой модели, так это то, что если модель бета-регрессии действительна, эта модель также действительна, но она устраняет некоторую чувствительность к экстремальным значениям. Однако это кажется таким естественным подходом, что мне интересно, почему я не нахожу никаких очевидных ссылок в литературе. Поэтому мой вопрос заключается в том, чтобы вместо изменения данных, почему бы не изменить модель. Изменение данных смещает результаты (исходя из предположения, что исходная модель действительна), тогда как изменение модели путем объединения экстремальных значений не смещает результаты.
Может быть, есть проблема, которую я пропускаю?