Что такое «насыщенная» модель?


Ответы:


36

Насыщенная модель - это модель, в которой оцениваемых параметров столько же, сколько точек данных. По определению, это приведет к идеальной подгонке, но статистически будет малопригодным, поскольку у вас нет данных для оценки дисперсии.

Например, если у вас есть 6 точек данных и соответствует полиному 5-го порядка для данных, у вас будет насыщенная модель (один параметр для каждой из 5 степеней вашей независимой переменной плюс один для постоянного члена).


18
Я видел примеры, где модель имеет десять точек данных и девять параметров. Указав на то, что модель имеет слишком много параметров, мне сказали, что R ^ 2 было 0,999, поэтому модель должна быть правильной!
csgillespie

4
Как можно прочитать из моего поста и поста Дэйва, насыщенные модели по определению не приводят к идеальной подгонке. но если вы будете использовать полином n-1 в качестве модели, они будут. см. оригинальную статью Сью Доу Ним на эту тему psych.fullerton.edu/mbirnbaum/papers/Nihm_18_1976.pdf
Хенрик,

24

Насыщенная модель - это модель, которая перенастраивается до такой степени, что она просто интерполирует данные. В некоторых настройках, таких как сжатие и реконструкция изображений, это не обязательно плохо, но если вы пытаетесь построить прогностическую модель, это очень проблематично.

Короче говоря, насыщенные модели приводят к предельно высоким дисперсионным предикторам, которые подвергаются воздействию шума больше, чем фактические данные.

В качестве мысленного эксперимента представьте, что у вас есть насыщенная модель, и в данных присутствует шум, а затем представьте, что модель подбирается несколько сотен раз, каждый раз с разной реализацией шума, и затем прогнозируется новая точка. Вы, вероятно, будете получать радикально разные результаты каждый раз, как для вашей подгонки, так и для вашего прогноза (и полиномиальные модели особенно вопиющи в этом отношении); другими словами, дисперсия соответствия и предиктора чрезвычайно высока.

Напротив, модель, которая не является насыщенной, будет (если она построена разумно) давать соответствия, которые более соответствуют друг другу даже при различной реализации шума, и дисперсия предиктора также будет уменьшена.


17

Модель насыщается тогда и только тогда, когда в ней столько параметров, сколько точек данных (наблюдений). Или, иначе говоря, в ненасыщенных моделях степени свободы больше нуля.

Это в основном означает, что эта модель бесполезна, потому что она не описывает данные более экономно, чем необработанные данные (а описание данных экономно, как правило, является идеей использования модели). Кроме того, насыщенные модели могут (но не обязательно) обеспечивать (бесполезную) идеальную подгонку, поскольку они просто интерполируют или повторяют данные.

Возьмем, например, среднее значение в качестве модели для некоторых данных. Если у вас есть только одна точка данных (например, 5), использование среднего значения (т. Е. 5; обратите внимание, что среднее является насыщенной моделью только для одной точки данных) не поможет вообще. Однако, если у вас уже есть две точки данных (например, 5 и 7), использование среднего значения (например, 6) в качестве модели дает вам более скупое описание, чем исходные данные.


8
Этот пункт о насыщенности, не подразумевающий идеальную подгонку, является самой интересной частью этой темы. Естественным примером такой ситуации была бы монотонная регрессия . Предположим, например, что вы знаете, что ваши значения должны увеличиваться с течением времени, и вы выполняете полиномиальную регрессию, ограничивая увеличение полиномов. Рассмотрим данные, в которых есть какая-то ошибка, поэтому иногда они немного уменьшаются. Тогда независимо от того, сколько параметров вы используете (даже если их больше, чем количество значений данных), вы никогда не подберете эти данные идеально.
whuber

17

Как все говорили ранее, это означает, что у вас столько же параметров, сколько у вас точек данных. Таким образом, нет ничего хорошего в пригодном тестировании. Но это не значит, что «по определению» модель может идеально соответствовать любой точке данных. Я могу сказать вам по личному опыту работы с некоторыми насыщенными моделями, которые не могли предсказать конкретные точки данных. Это довольно редко, но возможно.

Еще одна важная проблема заключается в том, что насыщенный не означает бесполезный. Например, в математических моделях человеческого познания параметры модели связаны с конкретными когнитивными процессами, имеющими теоретический фон. Если модель насыщена, вы можете проверить ее адекватность, выполнив целенаправленные эксперименты с манипуляциями, которые должны влиять только на конкретные параметры. Если теоретические прогнозы соответствуют наблюдаемым различиям (или отсутствию) в оценках параметров, то можно сказать, что модель верна.

Пример: представьте, например, модель, которая имеет два набора параметров, один для когнитивной обработки, а другой для двигательных реакций. Теперь представьте, что у вас есть эксперимент с двумя условиями, в одном из которых способность реагировать на участников снижается (они могут использовать только одну руку вместо двух), а в другом состоянии нет ухудшения. Если модель действительна, различия в оценках параметров для обоих условий должны возникать только для параметров реакции двигателя.

Кроме того, имейте в виду, что даже если одна модель ненасыщена, она все равно может быть неидентифицируемой, что означает, что различные комбинации значений параметров дают один и тот же результат, что ставит под угрозу любую подгонку модели.

Если вы хотите найти больше информации по этим вопросам в целом, вы можете взглянуть на эти документы:

Бамбер Д. и Ван Сантен, JPH (1985). Сколько параметров модель может иметь и все еще быть тестируемой? Журнал математической психологии, 29, 443-473.

Бамбер Д. и Ван Сантен, JPH (2000). Как оценить тестируемость и идентификацию модели. Журнал математической психологии, 44, 20-40.

ура


3

Это также полезно, если вам нужно рассчитать AIC для модели квази-правдоподобия. Оценка дисперсии должна исходить из насыщенной модели. Вы должны разделить LL, который вам подходит, на расчетную дисперсию из насыщенной модели в расчете AIC.


2

В контексте SEM (или анализа пути) насыщенная модель или только что идентифицированная модель - это модель, в которой число свободных параметров точно равно количеству дисперсий и уникальных ковариаций. Например, следующая модель является насыщенной моделью, поскольку имеется 3 * 4/2 точек данных (дисперсии и уникальные ковариации), а также 6 свободных параметров, которые необходимо оценить:

насыщенная модель

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.