Вопросы с тегом «model-selection»

Выбор модели - это проблема определения, какая модель из некоторого набора работает лучше всего. Популярные методы включают , критерии AIC и BIC, наборы тестов и перекрестную проверку. В некоторой степени выбор функции является подзадачей выбора модели. р2

2
Лучшие учебники по повторной выборке Bootstrap?
Я просто хотел спросить, какие, по вашему мнению, лучшие из доступных книг по начальной загрузке. Я имею в виду не только то, что написано его разработчиками. Не могли бы вы указать, какой учебник, по вашему мнению, лучше всего подходит для начальной загрузки и отвечает следующим критериям? Философская / эпистемологическая основа …

1
Можно ли рекомендовать книгу Бернхэма-Андерсона о многомодельном выводе?
В связи с недавним изменением статистики выбора модели по умолчанию в пакете прогноза R с AIC на AICc, мне любопытно, действительно ли последнее применимо везде, где первое. У меня есть ряд вопросов на этот счет, и вот первый. Я знаю, что заменять AIC на AICc везде - это то, что …

2
Предоставляет ли ступенчатая регрессия необъективную оценку r-квадрата населения?
В психологии и других областях часто используется форма ступенчатой ​​регрессии, которая включает в себя следующее: Посмотрите на остальные предикторы (сначала их нет в модели) и определите предиктор, который приведет к наибольшему изменению r-квадрата; Если значение p изменения r-квадрата меньше, чем альфа (обычно 0,05), включите этот предиктор и вернитесь к шагу …

5
Почему применение выбора модели с использованием AIC дает мне незначимые p-значения для переменных
У меня есть несколько вопросов об АПК и надеюсь, что вы мне поможете. Я применил выбор модели (назад или вперед) на основе AIC на моих данных. И некоторые из выбранных переменных оказались с p-значениями> 0,05. Я знаю, что люди говорят, что мы должны выбирать модели на основе AIC вместо p-значения, …

2
Выбор модели Box-Jenkins
Процедура выбора модели Бокса-Дженкинса в анализе временных рядов начинается с рассмотрения автокорреляционных и частичных автокорреляционных функций ряда. Эти графики могут предложить соответствующие и в модели ARMA . Процедура продолжается, предлагая пользователю применить критерии AIC / BIC для выбора наиболее экономной модели среди тех, которые дают модель с ошибкой в ​​виде …

4
В чем смысл одномерной регрессии до многомерной регрессии?
В настоящее время я работаю над проблемой, в которой у нас небольшой набор данных, и меня интересует причинно-следственное влияние лечения на результат. Мой консультант поручил мне выполнить одномерную регрессию для каждого предиктора с результатом в качестве ответа, а затем назначением лечения в качестве ответа. То есть меня просят согласовать регрессию …

2
Противоречивые подходы к выбору переменных: AIC, p-значения или оба?
Из того, что я понимаю, выбор переменных на основе p-значений (по крайней мере, в контексте регрессии) является в высшей степени ошибочным. Похоже, что выбор переменных на основе AIC (или аналогичных) также считается ошибочным по некоторым причинам, хотя это кажется немного неясным (например, см. Мой вопрос и некоторые ссылки по этой …

2
Линейная и нелинейная регрессия
У меня есть набор значений и которые теоретически связаны экспоненциально:xxxyyy y=axby=axby = ax^b Одним из способов получения коэффициентов является применение натуральных логарифмов с обеих сторон и подгонка линейной модели: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] Другой способ получить это - использовать нелинейную регрессию, учитывая …

2
Что такое чанк-тесты?
В ответ на вопрос о выборе модели в наличии мультиколлинеарности , Франк Харрелл предложил : Поместите все переменные в модель, но не проверяйте влияние одной переменной, скорректированной с учетом влияния конкурирующих переменных ... Кусочные тесты конкурирующих переменных являются мощными, потому что коллинеарные переменные объединяют силы в общем тесте ассоциации множественной …

2
Понимание начальной загрузки для проверки и выбора модели
Мне кажется, я понимаю, как работают основы самозагрузки , но я не уверен, что понимаю, как я могу использовать самозагрузку для выбора модели или чтобы избежать переобучения. Например, для выбора модели вы бы просто выбрали модель, которая дает наименьшую ошибку (может быть, дисперсию?) Во всех выборках начальной загрузки? Существуют ли …

2
Понимание AIC и критерий Шварца
Я управляю логистической моделью. Фактический набор данных модели содержит более 100 переменных, но я выбираю набор тестовых данных, в котором имеется около 25 переменных. До этого я также сделал набор данных, который имел 8-9 переменных. Мне говорят, что значения AIC и SC можно использовать для сравнения модели. Я заметил, что …

3
Использование информационной геометрии для определения расстояний и объемов ... полезно?
Я натолкнулся на большое количество литературы, в которой пропагандируется использование информационной метрики Фишера в качестве естественной локальной метрики в пространстве распределений вероятностей, а затем ее интеграция для определения расстояний и объемов. Но действительно ли эти «интегрированные» величины полезны для чего-либо? Я не нашел никаких теоретических обоснований и очень мало практических …

2
Есть ли обстоятельства, в которых следует использовать ступенчатую регрессию?
В прошлом поэтапная регрессия использовалась во многих биомедицинских работах, но, похоже, она улучшается благодаря лучшему пониманию многих ее проблем. Однако многие старые рецензенты все еще просят об этом. В каких обстоятельствах ступенчатая регрессия играет свою роль и должна использоваться, если таковая имеется?

1
Как сравнить модели на основе AIC?
У нас есть две модели, которые используют один и тот же метод для вычисления логарифмической вероятности, и AIC для одной ниже, чем другой. Тем не менее, тот с более низким AIC интерпретировать гораздо сложнее. У нас возникают проблемы с принятием решения, стоит ли вводить сложность, и мы судили об этом, …

1
Объясните шаги алгоритма LLE (локальное линейное вложение)?
Я понимаю, что основной принцип, лежащий в основе алгоритма LLE, состоит из трех этапов. Нахождение окрестности каждой точки данных по некоторой метрике, такой как k-nn. Найти веса для каждого соседа, которые обозначают влияние, которое сосед оказывает на точку данных. Построить низкоразмерное вложение данных на основе вычисленных весов. Но математическое объяснение …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.