В чем разница между «вложенной» и «не вложенной» моделью?


61

В литературе по иерархическим / многоуровневым моделям я часто читал о «вложенных моделях» и «не вложенных моделях», но что это значит? Может ли кто-нибудь дать мне несколько примеров или рассказать о математических последствиях этой фразы?


3
Это очень перегруженный термин, в зависимости от контекста. Вы были предупреждены.
Fmark

Ответы:


33

Вложенные и не вложенные могут означать много вещей. Вы имеете вложенные дизайны против скрещенных дизайнов (см., Например, это объяснение ). У вас есть вложенные модели в сравнении моделей. Вложенность означает здесь, что все члены меньшей модели встречаются в большей модели. Это необходимое условие для использования большинства тестов сравнения моделей, таких как тесты отношения правдоподобия.

В контексте многоуровневых моделей я думаю, что лучше говорить о вложенных и не вложенных факторах. Разница заключается в том, как различные факторы связаны друг с другом. Во вложенном проекте уровни одного фактора имеют смысл только в пределах уровней другого фактора.

Скажем, вы хотите измерить выработку кислорода листьями. Вы отбираете несколько видов деревьев, и на каждом дереве вы отбираете листья на нижней, средней и верхней части дерева. Это вложенный дизайн. Различие для листьев в другом положении имеет смысл только в пределах одного вида деревьев. Поэтому сравнивать нижние, средние и верхние листья над всеми деревьями бессмысленно. Или сказать иначе: положение листа не должно моделироваться как основной эффект.

Не вложенные факторы - это сочетание двух факторов, которые не связаны между собой. Допустим, вы изучаете пациентов и интересуетесь разницей в возрасте и поле. Таким образом, у вас есть фактор ageclass и фактор пола, которые не связаны между собой. Вы должны смоделировать возраст и пол в качестве основного эффекта, и вы можете взглянуть на взаимодействие при необходимости.

Разница не всегда так очевидна. Если в моем первом примере виды деревьев тесно связаны друг с другом по форме и физиологии, вы можете рассматривать положение листа также как действительный основной эффект. Во многих случаях выбор вложенного проекта по сравнению с не вложенным является скорее решением исследователя, чем истинным фактом.


12

Вложенные и не вложенные модели встречаются в совместном анализе и МИС . Рассмотрим «проблему с красным автобусом». У вас есть население, где 50% людей садятся на работу, а остальные 50% - на красный автобус. Что произойдет, если вы добавите в уравнение синюю шину, которая имеет те же характеристики, что и красная шина? Полиномиальной логит модель будет предсказывать долю 33% для всех трех режимов. Мы интуитивно знаем, что это не правильно, так как красный и синий автобус больше похожи друг на друга, чем на автомобиль, и поэтому они будут больше отдавать друг другу, прежде чем брать долю от автомобиля. Вот где появляется вложенная структура, которая обычно указывается как лямбда-коэффициент в аналогичных альтернативах.

Бен Акив собрал хороший набор слайдов с изложением теории по этому вопросу здесь . Он начинает говорить о вложенном логите вокруг слайда 23.


10

Одна модель вложена в другую, если вы всегда можете получить первую модель, ограничивая некоторые параметры второй модели. Например, линейная модель вложена в 2-градусный полином , потому что при установке b = 0 2-градус. полином становится идентичным линейной форме. Другими словами, линия является частным случаем многочлена, и поэтому они являются вложенными.y = a x + b x 2 + cy=ax+cy=ax+bx2+c

Главное следствие того, что две модели являются вложенными, заключается в том, что их сравнительно легко сравнивать статистически. Проще говоря, с помощью вложенных моделей вы можете считать, что более сложная модель создается путем добавления чего-либо к более простой «нулевой модели». Поэтому, чтобы выбрать лучшее из этих двух моделей, вам просто нужно выяснить, объясняет ли это что-то значительную дополнительную разницу в данных. Этот сценарий фактически эквивалентен сначала подгонке простой модели и удалению ее прогнозируемой дисперсии из данных, а затем подгонке дополнительного компонента более сложной модели к остаткам из первой подгонки (по крайней мере, с оценкой по методу наименьших квадратов).

Не вложенные модели могут объяснять совершенно разные части дисперсии в данных. Сложная модель может даже объяснить меньшую дисперсию, чем простая, если в сложную модель не входят «правильные вещи», которые есть у простой. Так что в этом случае немного сложнее предсказать, что произойдет при нулевой гипотезе, что обе модели объясняют данные одинаково хорошо.

Более того, в соответствии с нулевой гипотезой (и с учетом некоторых умеренных предположений), разница в соответствии между двумя вложенными моделями соответствует известному распределению, форма которого зависит только от разницы в степенях свободы между двумя моделей. Это не верно для не вложенных моделей.


отличное объяснение.
отметка

1

Две модели не являются вложенными или отдельными, если одна модель не может быть получена как предел другой (или одна модель не является частным случаем другой)


1
Можете ли вы уточнить, что вы подразумеваете под «пределом другого»? Вложенная модель может рассматриваться как модель, имеющая некоторое ограничение на пространство параметров по сравнению с другой, но я не уверен, что это то, что вы намеревались написать.
ЧЛ

Я имею в виду предел другого, например, экспоненциальное распределение является пределом гамма-распределения (а также распределения Вейбулла), когда параметр формы Beta обращается в 1.
Базилио де Браганса Перейра

1

Вы спрашивали о разнице между вложенными и не вложенными моделями. Видеть:

Там, где предмет необъявленных или отдельных моделей рассматривался впервые, или моя будущая книга: « Выбор отдельных или непроверенных моделей» .


1
Добро пожаловать на сайт @BasilioDeBragancaPereira. Было бы лучше дать краткое изложение того, что находится в этих газетах, чтобы читатели могли решить, хотят ли они выследить их и прочитать их. Также обратите внимание, что в ОП указаны «иерархические / многоуровневые модели» (учащиеся вложены в классы, вложенные в школы). Это тот контекст, на который вы здесь ссылаетесь?
gung - Восстановить Монику

-1

Смотрите более простой ответ в этом PDF . По сути, вложенная модель - это модель с меньшим количеством переменных, чем полная модель. Одно из намерений состоит в том, чтобы искать более скупые ответы.


7
К сожалению, это более простой ответ только потому, что он описывает «тип вложенной модели» другого типа, чем тот, о котором спрашивает OP. ОП спрашивает о вложенных моделях в контексте иерархических / многоуровневых моделей . Таким образом, этот ответ, хотя и является правильным в своих собственных терминах, является неправильным в контексте этой темы.
gung - Восстановить Монику

Ссылка не работает.
Вальдир Леонсио

Ссылка говорит «запрещено» для меня ... и вы мало что объясняете о том, что она говорит.
Glen_b
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.