Существует множество решений для случая раздуваемых (полу) непрерывных распределений:
- Регрессия Tobit : предполагает, что данные поступают из одного базового нормального распределения, но отрицательные значения подвергаются цензуре и суммируются на нуле (например, пакет censReg )
- препятствие или «двухэтапная» модель: используйте биномиальную модель, чтобы предсказать, являются ли значения 0 или> 0, затем используйте линейную модель (или гамму, или усеченное нормальное, или логическое нормальное), чтобы смоделировать наблюдаемые ненулевые значения
- 1 < р < 2х > 0
Или, если ваша структура данных достаточно проста, вы можете просто использовать линейные модели и использовать тесты перестановки или другой надежный подход, чтобы убедиться, что ваш вывод не будет испорчен интересным распределением данных.
Для большинства этих случаев доступны пакеты R / решения.
Есть другие вопросы по SE о ноль-накачанных (полу) непрерывных данных (например, здесь , здесь и здесь ), но они не дают четкого общего ответа ...
См. Также Min & Agresti, 2002, Моделирование неотрицательных данных со слиянием в ноль: обзор для обзора.