Как оценить добротность подгонки конкретной нелинейной модели? [закрыто]


10

У меня есть нелинейная модель , где Φ - cdf стандартного нормального распределения, а f - нелинейная (см. Ниже). Я хочу проверить пригодность этой модели с параметром a к моим данным ( x 1 , y 1 ) , ( x 2 , y 2 ) , , ( x n , y n )y=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn), После того , как оценка максимального правдоподобия б найти . Какой будет подходящий тест? Я хотел бы использовать этот тест, чтобы обозначить плохое соответствие как плохое и определить, следует ли собирать больше данных.a

Я рассмотрел использование отклонения, которое сравнивает эту модель с насыщенной моделью, с соответствующей проверкой правильности подгонки с использованием распределения . Это было бы уместно? Большая часть того, что я читал об отклонениях, применима к GLM, а это не то, что я имею. Если тест на отклонение подходит, какие допущения необходимо придерживаться, чтобы сделать тест действительным?χN-12

Обновление: дляx>1,a>0,если это помогает.езнак равноИкс-1aИкс2+1Икс>1,a>0


1
Ответ зависит от цели анализа и используемой вами модели вероятности; нет единственного или лучшего математического ответа. Например, для модели вида мы бы по-разному измерили добротность подгонки, чем для одной из форм y = Φ ( f ( x , a ) ) + ε (с IID ошибки εYзнак равноΦ(е(Икс,a)+ε)Yзнак равноΦ(е(Икс,a))+εε ).
whuber

Спасибо. Я уточнил свой вопрос. Я знаю, что лучшего ответа не существует, однако я все еще хотел бы знать, подходит ли отклонение для проверки пригодности здесь, и если нет, то какой еще тест подходит для обозначения соответствия как очень плохое и говорит, что нужно собирать больше данных (при условии, что модель верна) или говорит, что модель не описывает данные.
Spadequack

1
Ваша целевая переменная или она непрерывна? Если первое, то вы могли бы сформировать модель как p ( y = 1 ) = Φ ( f ( x , a ) ) вместо того, чтобы иметь аддитивную ошибку, и сравнить прогнозируемое с фактическим y = 0 и y = 1Y0,1п(Yзнак равно1)знак равноΦ(е(Икс,a))Yзнак равно0Yзнак равно1 чтобы получить истинные и ложные положительные показатели или сравнение с базовой моделью, где п(Yзнак равно1)знак равноY¯или отклонение, или несколько других альтернатив. Если последнее, какое распределение вы предполагаете для остатка?
jbowman

1
Голосование закрыто, потому что запрос на разъяснения остался без ответа.
whuber

Ответы:


1

Используйте пакет "npcmstest" в библиотеке "NP", если вы используете платформу R. Предупреждение: функция может занять несколько минут, чтобы оценить вашу модель.

Вы также можете рассмотреть теоретико-информационное сравнение распределения ответов и прогнозирующего распределения (т. Е. Дивергенцию KL, кросс-энтропию и т. Д.).


Кажется, что метод требует модель из lmили glm. Как это будет работать для нелинейной модели? (Да, я использую R.) Я добавил, что к моему вопросу на случай, если это поможет. е
Spadequack

@ Вы используете gamили что-то подобное ( mgcvпакет)? Если нет, вы должны проверить это.
Suncoolsu

1

Вот как я бы это сделал, в основном тест отношения правдоподобия. Но помните, что они являются «ключом» к пониманию пригодности теста на соответствие, чтобы понять класс альтернатив, с которыми вы тестируете. Теперь у нас есть вероятность для каждой отдельной точки данных как:

п(Yя|Икся,a,я)знак равног(εя)знак равног(Yя-ея)

г(ε)еязнак равноИкся-1aИкся2+1Иксяa(Икся,Yя)aеязнак равноYяχ2г(ε)ИксJ,YJYяa


1
О(N)

0

В контексте линейной регрессии тестирование на пригодность часто проводится в сравнении с более сложной альтернативой. У вас есть линейная регрессия - добавьте несколько полиномиальных терминов, чтобы проверить, достаточно ли линейной формы. Поскольку у вас уже есть нелинейная функциональная форма, сложной альтернативой, которую вы должны будете рассмотреть, должна быть непараметрическая регрессия . Я не буду пытаться представить введение в тему, поскольку она требует собственного мышления, и это стоит отдельного правильного введения. Для теста параметрических и непараметрических регрессий, Wooldridge (1992) или Hardle and Mammen (1993) , они делают очень похожие вещи. Хардл также написал отличную книгу на эту тему.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.