Вопросы с тегом «model-selection»

Выбор модели - это проблема определения, какая модель из некоторого набора работает лучше всего. Популярные методы включают , критерии AIC и BIC, наборы тестов и перекрестную проверку. В некоторой степени выбор функции является подзадачей выбора модели. р2

3
Когда уместно выбирать модели, сводя к минимуму AIC?
Хорошо известно, по крайней мере среди статистиков более высокого уровня, что модели со значениями статистики AIC в пределах определенного порога минимального значения следует рассматривать как соответствующие модели, минимизирующей статистику AIC. Например, в [1, с.221] находим Тогда модели с маленьким GCV или AIC будут считаться лучшими. Конечно, нельзя просто слепо минимизировать …

1
Выбор байесовской модели в PyMC3
Я использую PyMC3 для запуска байесовских моделей на моих данных. Я новичок в байесовском моделировании, но, согласно сообщениям в некоторых блогах , Википедии и QA с этого сайта, кажется правильным подход использовать фактор Байеса и критерий BIC, чтобы иметь возможность выбрать, какая модель лучше всего представляет мои данные (та, которая …

1
Как выбрать наилучшее соответствие без чрезмерных данных? Моделирование бимодального распределения с N нормальными функциями и т. Д.
У меня есть явно бимодальное распределение значений, которое я стараюсь соответствовать. Данные могут хорошо соответствовать либо 2 нормальным функциям (бимодальным), либо 3 нормальным функциям. Кроме того, существует вероятная физическая причина для сопоставления данных с 3. Чем больше параметров введено, тем более идеальным будет соответствие, поскольку при достаточном количестве констант можно …

1
Выбор модели в автономном режиме и онлайн-обучения
В последнее время я пытался узнать больше об онлайн-обучении (это абсолютно увлекательно!), И одна тема, которую я так и не смог понять, - как думать о выборе моделей в офлайновом и онлайн-контекстах. В частности, предположим , что мы тренируем классификатор в автономном режиме, на основе некоторого фиксированного набора данных D …

1
Что мне делать, если значения AIC низкие и приблизительно равны?
Крис Чатфилд, чьи многочисленные качественные книги и газеты мне нравилось читать, в (1) дает следующий совет: Например, вероятно, следует сделать выбор между моделями временных рядов ARIMA с низкими и приблизительно равными значениями AIC, причем не в тех случаях, когда получается минимальный AIC, а в отношении тех, которые дают наилучшие прогнозы …

5
Что делать с коллинеарными переменными
Отказ от ответственности: это для домашнего проекта. Я пытаюсь найти лучшую модель для цен на алмазы, в зависимости от нескольких переменных, и у меня пока что есть довольно хорошая модель. Однако я столкнулся с двумя переменными, которые явно коллинеарны: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 …

1
Выбор модели ABC
Было показано, что выбор модели ABC с использованием байесовских факторов не рекомендуется из-за наличия ошибки, связанной с использованием сводной статистики. Заключение в этой статье основано на изучении поведения популярного метода аппроксимации байесовского фактора (алгоритм 2). Хорошо известно, что байесовские факторы - не единственный способ выбора модели. Существуют и другие функции, …

2
Обобщенный логарифмический критерий отношения правдоподобия для не вложенных моделей
Я понимаю, что если у меня есть две модели A и B и A вложено в B, то, учитывая некоторые данные, я могу подобрать параметры A и B с помощью MLE и применить обобщенный тест логарифмического отношения правдоподобия. В частности, распределение теста должно быть с степенями свободы , где есть …

2
Превосходство LASSO над прямым выбором / обратным устранением с точки зрения ошибки прогнозирования перекрестной проверки модели
Я получил три уменьшенные модели из оригинальной полной модели, используя выбор вперед устранение в обратном направлении Техника наказания L1 (LASSO) Для моделей, полученных с использованием прямого выбора / обратного исключения, я получил перекрестную валидацию оценки ошибки прогнозирования, используя CVlmпакет, DAAGдоступный в R. Для модели, выбранной через LASSO, я использовал cv.glm. …

1
В чем принципиальная разница между этими двумя регрессионными моделями?
Предположим, у меня есть двумерные ответы со значительной корреляцией. Я пытаюсь сравнить два способа моделирования этих результатов. Один из способов - смоделировать разницу между двумя результатами: Другой способ - использовать или смоделировать их: (yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) Вот пример foo: #create foo data frame require(mvtnorm) require(reshape) set.seed(123456) sigma <- matrix(c(4,2,2,3), ncol=2) y <- …

3
Сравнение вложенных бинарных моделей логистической регрессии, когда большое
Чтобы лучше задать мой вопрос, я предоставил некоторые из выводов как из 16 переменных моделей ( fit), так и из 17 переменных моделей ( fit2) ниже (все предикторные переменные в этих моделях являются непрерывными, где единственное различие между этими моделями состоит в том, fitчто содержит переменную 17 (var17)): fit Model …

1
Сравнение распределений производительности обобщения
Скажем, у меня есть два метода обучения для задачи классификации , и , и что я оцениваю их эффективность обобщения с помощью чего-то вроде повторной перекрестной проверки или начальной загрузки. Из этого процесса я получаю распределение оценок и для каждого метода по всем этим повторениям (например, распределение значений ROC AUC …

1
Байесовские факторы с неподходящими априорами
У меня есть вопрос относительно сравнения моделей с использованием байесовских факторов. Во многих случаях статистики заинтересованы в использовании байесовского подхода с неподходящими априорами (например, с некоторыми априорами Джеффриса и эталонными априорами). Мой вопрос заключается в том, что в тех случаях, когда апостериорное распределение параметров модели четко определено, допустимо ли сравнивать …

1
Вопросы об определении линейных смешанных моделей в R для данных повторных измерений с дополнительной структурой вложенности
Структура данных > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 6.9 8.9 …

2
Стабильность модели в перекрестной проверке регрессионных моделей
С учетом множественных сгибов перекрестной проверки логистической регрессии и полученных в результате множественных оценок каждого коэффициента регрессии, как следует измерить, является ли предиктор (или набор предикторов) стабильным и значимым на основе коэффициента (ов) регрессии ? Отличается ли это для линейной регрессии?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.