Что такое идентификация модели?


38

Я знаю, что с моделью, которая не может быть идентифицирована, можно сказать, что данные создаются несколькими различными назначениями параметров модели. Я знаю, что иногда можно ограничить параметры так, чтобы все были идентифицируемыми, как в примере в Cassella & Berger 2nd ed, раздел 11.2.

Учитывая конкретную модель, как я могу оценить, можно ли ее идентифицировать?

Ответы:


46

Для идентификации мы говорим о параметре (который может быть вектором), который находится в пространстве параметров Θ , и о семействе распределений (для простоты, представьте PDF-файлы), индексированных по θ, которые мы обычно пишем что-то вроде { f θ |θΘθ . Например, θ может быть θ = β, а f может быть{fθ|θΘ}θθ=βf

что означает, чтоΘ=(0,). Для того, чтобы модель была идентифицируемой, преобразование, которое отображаетθвfθ,должно бытьвзаимно-однозначным. Учитывая модель на коленях, самый простой способ проверить это - начать с уравненияfθ 1 =fθ 2 (это равенство должно выполняться для (почти) всехxв

fθ(x)=1βex/β, x>0, β>0,
Θ=(0,)θfθfθ1=fθ2xподдержка ) и попытаться использовать алгебру (или какой -либо другой аргумент) , чтобы показать , что именно такое уравнение предполагает , что, по сути, & .θ1=θ2

Если вы преуспеете с этим планом, то ваша модель будет идентифицируемой; продолжай свой бизнес. Если вы этого не сделаете, то либо ваша модель не может быть идентифицирована, либо вам нужно найти другой аргумент. Интуиция одна и та же, независимо от того: в идентифицируемой модели невозможно, чтобы два разных параметра (которые могли быть векторами) приводили к одной и той же функции правдоподобия.

Это имеет смысл, потому что, если для фиксированных данных два уникальных параметра приводят к одинаковой вероятности, тогда будет невозможно провести различие между двумя параметрами-кандидатами на основе только данных. В этом случае невозможно определить истинный параметр.

Для приведенного выше примера уравнение равно 1fθ1=fθ2 для (почти) всехx>0. Если мы возьмем журналы обеих сторон мы получаем -пер

1β1ex/β1=1β2ex/β2,
x>0 приx>0, что подразумевает линейную функцию
lnβ1xβ1=lnβ2xβ2
x>0 (почти) тождественно равен нулю. Единственная линия, которая делает это, - это та, которая имеет наклон 0 и точку пересечения y с нулем. Надеюсь, вы сможете увидеть все остальное.
(1β11β2)x(lnβ1lnβ2)

f(y)=y2y[1,1]y[0,1]


2
(+1) Хорошее, всестороннее, практичное объяснение. Проводимые вами аналогии проясняют концепцию.
кардинал

Вы, конечно, ответили на вопрос, который я задал, но я слишком новичок, чтобы действительно понять ваш ответ. Если вы знаете объяснение, которое лучше для новичка, пожалуйста, дайте мне знать.
Джек Таннер

1
@ Cardinal, спасибо. Джеку, хорошо, я вижу. Как насчет этого: если есть что-то выше, что еще не ясно, и если вы укажете мне это, тогда я могу попытаться уточнить это еще немного. Или, если вы предпочитаете, вы можете написать еще один вопрос, который требует объяснения «мирянина» или примеров этих идей. Я думаю, было бы справедливо сказать, что идентификация - это тема, которая обычно возникает после типичного вводного периода обучения, поэтому, если вы хотите представить некоторый контекст того, почему вы сталкиваетесь с этим сейчас, это может помочь потенциальным ответчикам.

2
+1, хороший ответ. Возможно, стоит указать на один классический и легко видимый пример неидентифицируемой модели - неограниченную версию ANOVA:
YяJзнак равноμ+α1+α2+...+αК+εя
Чтобы исправить это, обычно используется эталонное кодирование соты , в котором среднее значение одного уровня задается в качестве эталонного (которое оценивается посредством перехвата), а общее среднее значение не оценивается в явном виде.
gung - Восстановить Монику

23

Одним из способов является проверка ковариационной матрицы, Σ, вашего параметра оценки. Если две оценки параметров идеально (приблизительно) коррелируют друг с другом или одна оценка параметров является (приблизительно) линейной комбинацией нескольких других, то ваша модель не идентифицируется; параметры, которые являются функциями других, не являются необходимыми. В каждом из этих случаевΣтакже будет (приблизительно) единичным. Так что еслиΣпримерно единственное число, это может дать вам повод для беспокойства по поводу проблем с идентификацией. (Хотя я не думаю, что это обнаружило бы нелинейные отношения между оценками параметров, которые привели бы к неидентификации).

Практическая проблема заключается в том, что часто трудно рассчитать Σ даже для слегка сложных моделей.

Если вы решаете задачу максимального правдоподобия, то вы знаете, что асимптотическая ковариационная матрица ваших оценок равна инверсии информации Фишера, оцененной в MLE. Таким образом, проверка информационной матрицы Фишера на наличие (приблизительной) особенности также является разумным способом оценки идентифицируемости. Это также работает в тех случаях, когда теоретическую информацию о Фишере трудно рассчитать, поскольку зачастую можно очень точно численно аппроксимировать согласованную оценку матрицы информации о Фишере, например, путем оценки ожидаемого внешнего продукта функции оценки по наблюдаемому среднему внешнему продукту. ,

Если вы не решаете проблему ОД, вы можете справиться с Σ путем моделирования данных из модели и оценки параметров большое количество раз и расчета выборочной ковариационной матрицы.


2
(+1) Молодец. Я даже не думал подойти к этому вопросу с этой стороны.

1
Одна из причин, по которой идея вычисления ковариационной матрицы на основе смоделированных данных особенно полезна, заключается в том, что в любом случае необходимо моделировать данные, чтобы выполнить проверку Кука-Гельмана-Рубина .
Джек Таннер
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.