Вопросы с тегом «model-selection»

Выбор модели - это проблема определения, какая модель из некоторого набора работает лучше всего. Популярные методы включают , критерии AIC и BIC, наборы тестов и перекрестную проверку. В некоторой степени выбор функции является подзадачей выбора модели. р2

1
Соответствующие остаточные степени свободы после отбрасывания членов из модели
Я размышляю над обсуждением этого вопроса и, в частности, комментарием Фрэнка Харрелла о том, что для оценки дисперсии в сокращенной модели (т. Е. Той, в которой ряд объясняющих переменных были проверены и отклонены) следует использовать Обобщенные степени свободы Йе . Профессор Харрелл указывает, что это будет намного ближе к остаточным …

3
Может ли AIC сравнивать разные модели?
Я использую AIC (информационный критерий Акаике) для сравнения нелинейных моделей в R. Допустимо ли сравнивать AIC разных типов моделей? В частности, я сравниваю модель, подобранную с помощью glm, с моделью со случайным термином эффекта, подобранной с помощью glmer (lme4). Если нет, то есть ли способ сделать такое сравнение? Или идея …

4
Как измерить / оценить «важность переменной» при использовании CART? (особенно используя {rpart} из R)
При построении модели CART (в частности, дерева классификации) с использованием rpart (в R) часто бывает интересно узнать, какова важность различных переменных, введенных в модель. Таким образом, мой вопрос: какие общие меры существуют для ранжирования / измерения важности переменных участвующих переменных в модели CART? И как это можно вычислить с помощью …

3
Предварительные условия для сравнения моделей AIC
Какие именно предварительные условия необходимо выполнить для сравнения моделей AIC для работы? Я только пришел к этому вопросу, когда я сделал сравнение, как это: > uu0 = lm(log(usili) ~ rok) > uu1 = lm(usili ~ rok) > AIC(uu0) [1] 3192.14 > AIC(uu1) [1] 14277.29 Таким образом, я оправдал logпреобразование переменной …

4
Решение проблемы неопределенности модели
Мне было интересно, как байесовцы в сообществе CrossValidated рассматривают проблему неопределенности модели и как они предпочитают с ней бороться? Я постараюсь изложить свой вопрос в двух частях: Насколько важно (по вашему опыту / мнению) иметь дело с неопределенностью модели? Я не нашел ни одной статьи, посвященной этой проблеме, в сообществе …

5
Какова польза от рассмотрения фактора как случайного в смешанной модели?
У меня есть проблема, заключающаяся в использовании преимуществ маркировки модельного фактора как случайного по нескольким причинам. Мне кажется, что почти во всех случаях оптимальное решение состоит в том, чтобы рассматривать все факторы как фиксированные. Во-первых, различие между фиксированным и случайным совершенно произвольно. Стандартное объяснение состоит в том, что, если кто-то …

4
У вас есть глобальное видение тех методов анализа?
В настоящее время я работаю над проектом, в котором, как и всем нам, мне нужно понять, как выход связан с входом . Особенность в том, что данные выдаются мне по одному фрагменту за раз, поэтому я хочу обновлять свой анализ каждый раз, когда получаю новый . Я считаю, что это …

2
Стабильность темы в моделях темы
Я работаю над проектом, в котором я хочу извлечь некоторую информацию о содержании серии открытых эссе. В этом конкретном проекте 148 человек написали эссе о гипотетической организации студентов в рамках более крупного эксперимента. Хотя в моей области (социальная психология) типичным способом анализа этих данных было бы ручное кодирование эссе, я …

3
AIC против перекрестной проверки во временных рядах: небольшой пример
Я заинтересован в выборе модели в настройке временных рядов. Для конкретности предположим, что я хочу выбрать модель ARMA из пула моделей ARMA с различными порядками запаздывания. Конечная цель - прогнозирование . Выбор модели может быть сделан перекрестная проверка, использование информационных критериев (AIC, BIC), среди других методов. Роб Дж. Хиндман предоставляет …

2
Почему доказательство Уилкса 1938 года не работает для неправильно определенных моделей?
В известной работе 1938 года (« Распределение отношения правдоподобия для большой выборки при проверке составных гипотез », Анналы математической статистики, 9: 60–62) Самуэль Уилкс вывел асимптотическое распределение в (логарифмическое отношение правдоподобия) для вложенных гипотез в предположении, что большая гипотеза указана правильно. Предельное распределение (хи-квадрат) со степенями свободы , где - …

4
Когда применимы результаты Шао по кросс-проверке с пропуском?
В своей статье « Выбор линейной модели с помощью перекрестной проверки» Джун Шао показывает, что для задачи выбора переменных в многомерной линейной регрессии метод перекрестной проверки «без выходных данных» (LOOCV) является «асимптотически несовместимым». Проще говоря, он имеет тенденцию выбирать модели со слишком большим количеством переменных. В симуляционном исследовании Шао показывает, …

1
Выбор среди правильных правил подсчета очков
В большинстве ресурсов о правильных правилах оценки упоминается ряд различных правил оценки, таких как потеря журнала, оценка Бриера или сферическая оценка. Тем не менее, они часто не дают больших указаний на различия между ними. (Приложение A: Википедия .) Выбор модели, которая максимизирует логарифмическую оценку, соответствует выбору модели максимального правдоподобия, которая …

3
Стабильность модели при решении большой проблемы , small
Вступление: У меня есть набор данных с классической «большой p, маленький n проблема». Количество доступных выборок n = 150, а количество возможных предикторов p = 400. Результат - непрерывная переменная. Я хочу найти самые «важные» дескрипторы, то есть те, которые являются лучшими кандидатами для объяснения результата и помощи в построении …

2
Лучший подход для выбора модели байесовской или перекрестной проверки?
При попытке выбора между различными моделями или количеством функций, например, для прогнозирования, я могу придумать два подхода. Разделите данные на обучающие и тестовые наборы. Еще лучше использовать начальную загрузку или перекрестную проверку в k-кратном порядке. Каждый раз тренируйтесь на тренировочном наборе и рассчитывайте погрешность на тестовом наборе. Ошибка проверки графика …

2
Какое свойство оценки у оракула?
Какое свойство оценки у оракула ? Для каких целей моделирования имеет значение свойство оракула (предиктивный, объяснительный, ...)? И теоретически строгие, и (особенно) интуитивные объяснения приветствуются.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.