Сравните соответствия модели с преобразованным и нетрансформированным ответом


11

Я хочу сравнить данные, которые пропорции между тремя различными группами, например:

 ID Group Prop.Nitrogen
 1    A     0.89
 2    A     0.85
 3    B     0.92
 4    B     0.97

Вслед за Уортоном и Хуэем (doi: 10.1890 / 10-0340.1 1 ) я подумал, что лучше посмотреть, будут ли эти данные лучше обрабатывать с использованием преобразованного логита.

Когда я смотрю на диагностические графики для линейных моделей на преобразованных и не преобразованных данных, они выглядят очень похожими, без явных проблем, и есть только небольшие различия в оценочных параметрах. Однако я все же хотел бы сказать, насколько хорошо модель подходит для преобразованных и нетрансформированных версий данных - я знаю, что не могу сравнивать значения AIC напрямую. Есть ли исправление, и я могу сделать, чтобы изучить это? Или я должен использовать другой подход?


Возможно, вы захотите попробовать преобразование Бокса-Кокса ( boxcox()в библиотеке MASS), хотя я не уверен, может ли оно иметь дело с преобразованиями logit.
Мариус

@Marius: чтобы уточнить, вы предлагаете boxcox()исходные данные или преобразованные данные?
Мишель

Как насчет преобразования данных и установленных значений в соответствующую предметную шкалу (чтобы у вас была единая шкала), а затем вычисление AIC для всех ваших конкурирующих моделей? Вы должны были бы рассчитать значения AIC вручную для моделей, которые были изначально подогнаны под другой масштаб, но я не думаю, что это может быть проблемой.
Ричард Харди

Ответы:


1

Мой опыт работы с преобразованными данными позволяет предположить, что корреляция улучшается после преобразования, а также гомоскедастичности и / или нормальности, хотя они не обязательно являются оптимальными для какого-либо отдельного преобразования. Одним простым ответом может быть вычисление коэффициентов корреляции между двумя моделями и их соответствующими наборами данных. Можно даже проверить на значимость различия коррелированных коэффициентов корреляции. Тесты на гомоскедастичность и функцию функции плотности остатков также могут предложить средства для их оценки.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.