Вопросы с тегом «model-selection»

Выбор модели - это проблема определения, какая модель из некоторого набора работает лучше всего. Популярные методы включают , критерии AIC и BIC, наборы тестов и перекрестную проверку. В некоторой степени выбор функции является подзадачей выбора модели. р2

1
Гамма GLM с логарифмической связью против гауссовой GLM с логарифмической связью против LM с логарифмическим преобразованием
Из моих результатов видно, что GLM Gamma отвечает большинству допущений, но стоит ли это значительного улучшения по сравнению с лог-преобразованным LM? Большая часть литературы, которую я нашел, посвящена пуассоновским или биномиальным GLM. Я нашел статью ОЦЕНКА ОБОБЩЕНИЙ ОБОБЩЕННОЙ ЛИНЕЙНОЙ МОДЕЛИ С ИСПОЛЬЗОВАНИЕМ Рандомизации очень полезной, но в ней отсутствуют реальные …

1
Можете ли вы сравнить значения AIC, если модели основаны на одном и том же наборе данных?
Я делаю некоторые прогнозы в R, используя пакет прогнозов Роба Хиндмана . Бумага, принадлежащая упаковке, может быть найдена здесь . В статье после объяснения алгоритмов автоматического прогнозирования авторы реализуют алгоритмы на одном и том же наборе данных. Однако, после оценки как экспоненциального сглаживания, так и модели ARIMA, они делают заявление, …

1
Термины взаимодействия и полиномы высших порядков
Если бы меня интересовало согласование двусторонних взаимодействий между линейной объясняющей переменной и другой объясняющей переменной b, которая имеет квадратичную связь с зависимой переменной y , мне бы пришлось включить как взаимодействие с квадратичным компонентом, так и взаимодействие с линейным компонент в модели? Например: y ∼ a + b + b …

2
Возможно ли, что AIC и BIC дают совершенно разные модели выбора?
Я выполняю модель пуассоновской регрессии с 1 переменной отклика и 6 ковариатами. Выбор модели с использованием AIC приводит к получению модели со всеми ковариатами, а также с 6 терминами взаимодействия. BIC, однако, приводит к модели только с 2 ковариатами и без условий взаимодействия. Возможно ли, что два критерия, которые выглядят …

1
Выбор переменной против выбора модели
Поэтому я понимаю, что выбор переменной является частью выбора модели. Но из чего конкретно состоит выбор модели? Это больше, чем следующее: 1) выберите дистрибутив для вашей модели 2) выбрать объясняющие переменные,? Я спрашиваю об этом, потому что я читаю статью Burnham & Anderson: AIC против BIC, где они говорят об …

1
Когда мне следует беспокоиться о парадоксе Джеффриса-Линдли в выборе байесовской модели?
Я рассматриваю большое (но конечное) пространство моделей различной сложности, которые я исследую с помощью RJMCMC . Приоритет вектора параметров для каждой модели достаточно информативен. В каких случаях (если таковые имеются) я должен беспокоиться о парадоксе Джеффриса-Линдли в пользу более простых моделей, когда одна из более сложных моделей будет более подходящей? …

1
В чем разница между «проверкой гипотез» и «выбором модели»?
В литературе оба термина часто используются как синонимы или переплетаются. Сейчас я пытаюсь найти четкое различие между обоими терминами. С моей точки зрения, гипотеза обычно выражается через модель. Поэтому, даже если мы проверяем гипотезу «ноль против альтернативы», с моей точки зрения, мы делаем выбор модели. Может ли кто-нибудь дать мне …

3
Байесовский против MLE, проблема переоснащения
В книге Бишопа по PRML он говорит, что переоснащение - это проблема с оценкой максимального правдоподобия (MLE), и байесовский может ее избежать. Но я думаю, что переоснащение - это проблема скорее выбора модели, а не метода, используемого для оценки параметров. То есть, предположим, что у меня есть набор данных , …

1
AIC для не вложенных моделей: нормализующая константа
АИК определяется как , где θ является оценкой максимального правдоподобия и р является размерность пространства параметров. Для оценки θА яС= - 2 журнала( L ( θ^) ) + 2 рAIC=−2log⁡(L(θ^))+2pAIC=-2 \log(L(\hat\theta))+2pθ^θ^\hat\thetaпppθθ\thetaобычно пренебрегают постоянным фактором плотности. Это фактор, который не зависит от параметров, чтобы упростить вероятность. С другой стороны, этот фактор …

4
Выбор модели PCA с использованием AIC (или BIC)
Я хочу использовать Информационный критерий Акаике (AIC), чтобы выбрать соответствующее количество факторов для извлечения в PCA. Единственная проблема заключается в том, что я не уверен, как определить количество параметров. Рассмотрим матрицу , где представляет количество переменных, а - количество наблюдений, таких что . Поскольку ковариационная матрица симметрична, то оценка максимального …

1
Различия между PROC Mixed и lme / lmer в R - степени свободы
Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между PROC MIXEDи lme, и я задавался вопросом, почему. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Как использовать анализ главных компонентов для выбора переменных для регрессии?
В настоящее время я использую анализ основных компонентов, чтобы выбрать переменные для моделирования. В настоящий момент я делаю измерения A, B и C в своих экспериментах. Что я действительно хочу знать: могу ли я сделать меньше измерений и прекратить запись C и / B, чтобы сэкономить время и усилия? Я …

1
Проверка эквивалентности не вложенных моделей
Скажем, - линейная функция от и фиктивная . Моя гипотеза состоит в том, что само по себе , как гедонистическому индексу вектора других переменных, . У меня есть поддержка для этого в из (т.е. , , ..., ) на . Есть ли способ проверить эквивалентность этих двух моделей:x d d …

2
GLM после выбора модели или регуляризации
Я хотел бы поставить этот вопрос в двух частях. Оба имеют дело с обобщенной линейной моделью, но первый касается выбора модели, а другой - регуляризации. Справочная информация: Я использую модели GLM (линейная, логистическая, гамма-регрессия) как для прогнозирования, так и для описания. Когда я ссылаюсь на « нормальные вещи, которые каждый …

1
Точный критерий Фишера и гипергеометрическое распределение
Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.