Вопросы с тегом «modeling»

Этот тег описывает процесс создания статистической или машинной модели обучения. Всегда добавляйте более конкретный тег.

2
Учитывая две модели линейной регрессии, какая модель будет работать лучше?
Я взял курс машинного обучения в моем колледже. В одной из викторин был задан этот вопрос. Модель 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Модель 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Какая из вышеперечисленных моделей подойдет для данных лучше? (предположим, что данные могут быть …

3
Концепции, лежащие в основе моделей с фиксированными / случайными эффектами
Может ли кто-нибудь помочь мне понять модели с фиксированным / случайным эффектом? Вы можете либо объяснить по-своему, если вы переварили эти понятия, либо направить меня к ресурсу (книга, заметки, веб-сайт) с конкретным адресом (номер страницы, глава и т. Д.), Чтобы я мог изучить их без какой-либо путаницы. Правда ли это: …

1
Соотношения в регрессии, ака Вопросы о Кронмале
В последнее время вопросы случайного просмотра вызвали у меня воспоминания о том, что один из моих профессоров несколько лет назад предупреждал об использовании коэффициентов в регрессионных моделях. Так что я начал читать об этом, что привело к Кронмал 1993 года. Я хочу убедиться, что я правильно интерпретирую его предложения о …

2
Модель для оценки плотности населения
База данных (население, площадь, форма) может быть использована для отображения плотности населения путем назначения постоянной величины населения / площади для каждой фигуры (которая является многоугольником, таким как блок переписи, участок, округ, штат и т. Д.). Однако популяции обычно не равномерно распределены по своим полигонам. Дасиметрическое отображение - это процесс уточнения …

2
Объяснить корректировку модели на простом английском
Читая о методах и результатах статистического анализа, особенно в эпидемиологии, я очень часто слышу о корректировке или контроле моделей. Как бы вы объяснили не статистику цель этого? Как вы интерпретируете свои результаты после контроля определенной переменной? Небольшой проход в Stata или R, или указатель на один онлайн, станет настоящим украшением.

3
Замена переменных на WoE (вес доказательств) в логистической регрессии
Это вопрос, касающийся практики или метода, которым следуют некоторые из моих коллег. При создании модели логистической регрессии я видел, как люди заменяли категориальные переменные (или непрерывные переменные, которые сгруппированы) на соответствующий вес доказательств (WoE). Предположительно это делается для установления монотонной связи между регрессором и зависимой переменной. Теперь, насколько я понимаю, …

2
Является ли прогноз «золотым критерием» для оценки способности статистиков?
Я читал линейные модели Faraway из учебника с R (1-е издание) в прошлые выходные. У Faraway была глава под названием «Статистическая стратегия и модель неопределенности». Он описал (стр 158) , что он искусственно созданный некоторые данные , используя очень сложную модель, то он попросил своих студентов моделировать данные и сравнить …

1
Параметры против скрытых переменных
Я спрашивал об этом раньше и действительно пытался определить, что делает параметр модели, а что скрытой переменной. Итак, глядя на различные темы по этой теме на этом сайте, основное различие выглядит следующим образом: Скрытые переменные не наблюдаются, но имеют связанное с ними распределение вероятностей, так как они являются переменными, а …

1
Аддитивная ошибка или мультипликативная ошибка?
Я относительно новичок в статистике и был бы признателен за помощь в понимании этого вопроса. В моей области есть широко используемая модель вида: пT= Pо( VT)αпTзнак равнопо(ВT)αP_t = P_o(V_t)^\alpha Когда люди подгоняют модель к данным, они обычно линеаризуют ее и соответствуют следующим журнал( PT) = журнал( Pо) + α log( …

1
AIC / BIC: для скольких параметров нужна перестановка?
Допустим, у меня проблема с выбором модели, и я пытаюсь использовать AIC или BIC для оценки моделей. Это просто для моделей, которые имеют некоторое число вещественных параметров.kkk Однако что, если одна из наших моделей (например, модель Мэллова ) имеет перестановку плюс некоторые вещественно-значимые параметры вместо просто вещественно-значимых параметров? Я все …

1
Методы анализа соотношений
Я ищу советы и комментарии, которые касаются анализа соотношений и ставок. В области, в которой я работаю, анализ коэффициентов, в частности, широко распространен, но я прочитал несколько статей, которые предполагают, что это может быть проблематично, я думаю о: Кронмаль, Ричард А. 1993. Ложная корреляция и ошибка стандарта соотношения вновь. Журнал …

2
Осложнения наличия очень маленькой выборки в модели структурного уравнения
Я использую модель структурного уравнения (SEM) в Amos 18. Я искал 100 участников для моего эксперимента (использовался свободно), которого, вероятно, было недостаточно для успешного проведения SEM. Мне неоднократно говорили, что SEM (наряду с EFA, CFA) является статистической процедурой "большой выборки". Короче говоря, я не добрался до 100 участников (какой сюрприз!), …

1
LARS против координатного спуска для лассо
Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи также будут оценены. редактировать: так как я разместил вопрос, chl любезно указал …

5
Когда использовать несколько моделей для прогнозирования?
Это довольно общий вопрос: Как правило, я обнаружил, что использование нескольких различных моделей превосходит одну модель при попытке предсказать временной ряд из выборки. Есть ли хорошие статьи, которые демонстрируют, что комбинация моделей превзойдет одну модель? Есть ли лучшие практики по объединению нескольких моделей? Некоторые ссылки: Hui Zoua, Yuhong Yang "Объединение …

1
Пакет GBM против Карет с использованием GBM
Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в качестве метрики оценки. Я хочу найти оптимальную производительность …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.