Это кажется таким элементарным, но я всегда застреваю на этом этапе ...
Большинство данных, с которыми я имею дело, являются ненормальными, и большинство анализов основано на структуре GLM. Для моего текущего анализа у меня есть переменная ответа, которая является "скоростью ходьбы" (метры в минуту). Мне легко определить, что я не могу использовать OLS, но тогда у меня есть большая неуверенность в решении, какая семья (Гамма, Вейбулл и т. Д.) Является подходящей!
Я использую Stata и смотрю на диагностику как остатки и гетероскедастичность, остатки против подгоночных значений и т. Д.
Я знаю, что данные подсчета могут принимать форму коэффициента (например, коэффициентов заболеваемости) и использовать гамму (аналог перерассеянных дискретных отрицательных биномиальных моделей), но просто хотел бы, чтобы «курящий пистолет» сказал ДА, ВЫ ИМЕЕТЕ ПРАВО СЕМЬЯ. Является ли рассмотрение стандартизированных остатков в сравнении с установленными значениями единственным и лучшим способом сделать это? Я хотел бы использовать смешанную модель для учета некоторой иерархии в данных, но сначала нужно разобраться, какое семейство лучше всего описывает мою переменную ответа.
Любая помощь приветствуется. Язык Stata особенно ценится!