Недавно я был заинтересован в реализации модели бета-регрессии, для получения результата, который является пропорцией. Обратите внимание, что этот результат не будет вписываться в биномиальный контекст, потому что в этом контексте нет осмысленной концепции дискретного «успеха». Фактически, результат - это пропорция продолжительности; числитель - это количество секунд, в течение которых определенное условие активно в течение общего количества секунд, в течение которых условие могло быть активным. Я прошу прощения за причуды, но я не хочу сосредотачиваться слишком сильно на этом конкретном контексте, потому что я понимаю, что существует целый ряд способов, которыми можно смоделировать такой процесс, кроме бета-регрессии, и сейчас я больше интересуюсь конкретно теоретическими вопросы, которые возникли в моих попытках реализовать такую модель (хотя я, конечно,
В любом случае, все ресурсы, которые я смог найти, указали, что бета-регрессия обычно подходит с использованием ссылки logit (или probit / cloglog), а параметры интерпретируются как изменения в log-odds. Тем не менее, мне еще предстоит найти ссылку, которая фактически обеспечивает какое-либо реальное обоснование того, почему кто-то захочет использовать эту ссылку.
Оригинальная статья Ferrari & Cribari-Neto (2004) не дает оправдания; они отмечают только то, что функция logit является «особенно полезной» из-за интерпретации отношения шансов экспоненциальных параметров. Другие источники ссылаются на желание отобразить интервал (0,1) на реальную линию. Тем не менее, обязательно ли нам нужна функция связи для такого отображения, учитывая, что мы уже предполагаем бета-распределение? Какие преимущества дает функция ссылки, помимо ограничений, налагаемых при начале бета-распространения?Я провел несколько быстрых симуляций и не видел прогнозов вне интервала (0,1) с идентифицирующей связью, даже когда симулировал из бета-распределений, масса вероятности которых в значительной степени сгруппирована близко к 0 или 1, но, возможно, мои симуляции не были достаточно общими, чтобы поймать некоторые из патологий.
Мне кажется, основываясь на том, как люди на практике интерпретируют оценки параметров из моделей бета-регрессии (то есть как отношения шансов), что они неявно делают вывод относительно шансов «успеха»; то есть они используют бета-регрессию как замену биномиальной модели. Возможно, это уместно в некоторых контекстах, учитывая взаимосвязь между бета-версиями и биномиальными распределениями, но мне кажется, что это должен быть более частный случай, чем общий. В этом вопросе дан ответ для интерпретации отношения шансов по отношению к непрерывной пропорции, а не к результату, но мне кажется излишне громоздким пытаться интерпретировать вещи таким образом, в отличие от использования, скажем, журнала или идентификационная ссылка и интерпретация% изменений или сдвигов.
Итак, почему мы используем ссылку logit для моделей бета-регрессии? Это просто для удобства, чтобы связать это с биномиальными моделями?