В литературе по иерархическим / многоуровневым моделям я часто читал о «вложенных моделях» и «не вложенных моделях», но что это значит? Может ли кто-нибудь дать мне несколько примеров или рассказать о математических последствиях этой фразы?
В литературе по иерархическим / многоуровневым моделям я часто читал о «вложенных моделях» и «не вложенных моделях», но что это значит? Может ли кто-нибудь дать мне несколько примеров или рассказать о математических последствиях этой фразы?
Ответы:
Вложенные и не вложенные могут означать много вещей. Вы имеете вложенные дизайны против скрещенных дизайнов (см., Например, это объяснение ). У вас есть вложенные модели в сравнении моделей. Вложенность означает здесь, что все члены меньшей модели встречаются в большей модели. Это необходимое условие для использования большинства тестов сравнения моделей, таких как тесты отношения правдоподобия.
В контексте многоуровневых моделей я думаю, что лучше говорить о вложенных и не вложенных факторах. Разница заключается в том, как различные факторы связаны друг с другом. Во вложенном проекте уровни одного фактора имеют смысл только в пределах уровней другого фактора.
Скажем, вы хотите измерить выработку кислорода листьями. Вы отбираете несколько видов деревьев, и на каждом дереве вы отбираете листья на нижней, средней и верхней части дерева. Это вложенный дизайн. Различие для листьев в другом положении имеет смысл только в пределах одного вида деревьев. Поэтому сравнивать нижние, средние и верхние листья над всеми деревьями бессмысленно. Или сказать иначе: положение листа не должно моделироваться как основной эффект.
Не вложенные факторы - это сочетание двух факторов, которые не связаны между собой. Допустим, вы изучаете пациентов и интересуетесь разницей в возрасте и поле. Таким образом, у вас есть фактор ageclass и фактор пола, которые не связаны между собой. Вы должны смоделировать возраст и пол в качестве основного эффекта, и вы можете взглянуть на взаимодействие при необходимости.
Разница не всегда так очевидна. Если в моем первом примере виды деревьев тесно связаны друг с другом по форме и физиологии, вы можете рассматривать положение листа также как действительный основной эффект. Во многих случаях выбор вложенного проекта по сравнению с не вложенным является скорее решением исследователя, чем истинным фактом.
Вложенные и не вложенные модели встречаются в совместном анализе и МИС . Рассмотрим «проблему с красным автобусом». У вас есть население, где 50% людей садятся на работу, а остальные 50% - на красный автобус. Что произойдет, если вы добавите в уравнение синюю шину, которая имеет те же характеристики, что и красная шина? Полиномиальной логит модель будет предсказывать долю 33% для всех трех режимов. Мы интуитивно знаем, что это не правильно, так как красный и синий автобус больше похожи друг на друга, чем на автомобиль, и поэтому они будут больше отдавать друг другу, прежде чем брать долю от автомобиля. Вот где появляется вложенная структура, которая обычно указывается как лямбда-коэффициент в аналогичных альтернативах.
Бен Акив собрал хороший набор слайдов с изложением теории по этому вопросу здесь . Он начинает говорить о вложенном логите вокруг слайда 23.
Одна модель вложена в другую, если вы всегда можете получить первую модель, ограничивая некоторые параметры второй модели. Например, линейная модель вложена в 2-градусный полином , потому что при установке b = 0 2-градус. полином становится идентичным линейной форме. Другими словами, линия является частным случаем многочлена, и поэтому они являются вложенными.y = a x + b x 2 + c
Главное следствие того, что две модели являются вложенными, заключается в том, что их сравнительно легко сравнивать статистически. Проще говоря, с помощью вложенных моделей вы можете считать, что более сложная модель создается путем добавления чего-либо к более простой «нулевой модели». Поэтому, чтобы выбрать лучшее из этих двух моделей, вам просто нужно выяснить, объясняет ли это что-то значительную дополнительную разницу в данных. Этот сценарий фактически эквивалентен сначала подгонке простой модели и удалению ее прогнозируемой дисперсии из данных, а затем подгонке дополнительного компонента более сложной модели к остаткам из первой подгонки (по крайней мере, с оценкой по методу наименьших квадратов).
Не вложенные модели могут объяснять совершенно разные части дисперсии в данных. Сложная модель может даже объяснить меньшую дисперсию, чем простая, если в сложную модель не входят «правильные вещи», которые есть у простой. Так что в этом случае немного сложнее предсказать, что произойдет при нулевой гипотезе, что обе модели объясняют данные одинаково хорошо.
Более того, в соответствии с нулевой гипотезой (и с учетом некоторых умеренных предположений), разница в соответствии между двумя вложенными моделями соответствует известному распределению, форма которого зависит только от разницы в степенях свободы между двумя моделей. Это не верно для не вложенных моделей.
Две модели не являются вложенными или отдельными, если одна модель не может быть получена как предел другой (или одна модель не является частным случаем другой)
Вы спрашивали о разнице между вложенными и не вложенными моделями. Видеть:
Там, где предмет необъявленных или отдельных моделей рассматривался впервые, или моя будущая книга: « Выбор отдельных или непроверенных моделей» .
Смотрите более простой ответ в этом PDF . По сути, вложенная модель - это модель с меньшим количеством переменных, чем полная модель. Одно из намерений состоит в том, чтобы искать более скупые ответы.