Вопросы с тегом «residuals»

Остатки модели - это фактические значения за вычетом прогнозных значений. Многие статистические модели делают предположения об ошибке, которая оценивается по остаткам.

2
Оценка моделей логистической регрессии
Этот вопрос возникает из-за моей путаницы в том, как решить, достаточно ли хороша логистическая модель. У меня есть модели, которые используют состояние пар индивидуальный проект через два года после их формирования в качестве зависимой переменной. Результат успешен (1) или нет (0). У меня есть независимые переменные, измеренные во время формирования …

2
Семейство GLM представляет собой распределение переменной ответа или остатков?
Я обсуждал это с несколькими сотрудниками лаборатории, и мы обратились к нескольким источникам, но до сих пор не получили ответа: Когда мы говорим, что у GLM есть семейство пуассонов , скажем, мы говорим о распределении остатков или переменной отклика? Спорные вопросы Читая эту статью, она утверждает, что допущения GLM - …

1
Пакет GBM против Карет с использованием GBM
Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в качестве метрики оценки. Я хочу найти оптимальную производительность …

3
Остаточная автокорреляция по сравнению с лаговой зависимой переменной
При моделировании временных рядов можно (1) смоделировать корреляционную структуру слагаемых ошибок, например, процесс AR (1) (2) включает в себя переменную с запаздыванием в качестве объясняющей переменной (справа) Я понимаю, что их иногда есть веские причины для (2). Однако, каковы методологические причины, чтобы сделать (1) или (2) или даже оба?

2
Являются ли нормально распределенные X и Y более вероятными в результате нормально распределенных остатков?
Здесь обсуждается неправильное толкование предположения о нормальности в линейной регрессии (что «нормальность» относится к X и / или Y, а не к остаткам), и автор спрашивает, возможно ли иметь ненормально распределенные X и Y и все еще имеют нормально распределенные остатки. Мой вопрос: нормально ли распределены X и Y с …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
Допущения остаточного распределения регрессии
Почему необходимо сделать предположение о распределении ошибок, т.е. ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , с .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Почему бы не написать у я ~ Н ( Х β , сг 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , с ,yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim …

2
Почему некоторые люди проверяют допущения регрессионных моделей на своих необработанных данных, а другие проверяют их на остаточных данных?
Я аспирант в области экспериментальной психологии, и я стараюсь улучшить свои навыки и знания о том, как анализировать мои данные. До пятого курса психологии я думал, что регрессионные модели (например, ANOVA) предполагают следующее: нормальность данных однородность дисперсии для данных и так далее Мои курсы бакалавриата заставляют меня полагать, что предположения …

2
Каково ожидаемое распределение остатков в обобщенной линейной модели?
Я выполняю обобщенную линейную модель, где я должен указать семью, отличную от нормальной. Каково ожидаемое распределение остатков? Например, должны ли остатки распределяться нормально?

2
Логистический регрессионный анализ остатков
Этот вопрос довольно общий и многословный, но, пожалуйста, потерпите меня. В моем приложении у меня есть много наборов данных, каждый из которых состоит из ~ 20 000 точек данных с ~ 50 объектами и одной зависимой двоичной переменной. Я пытаюсь смоделировать наборы данных с помощью регуляризованной логистической регрессии (пакет R …

1
Точный критерий Фишера и гипергеометрическое распределение
Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст …

2
Гетероскедастичность и нормальность остатков
Полагаю, у меня неплохая линейная регрессия (это для университетского проекта, поэтому мне не нужно быть очень точным). Дело в том, что если я построю график зависимости остатков от прогнозируемых значений, то (по словам моего учителя) есть намек на гетероскедастичность. Но если я нанесу QQ-график остатков, ясно, что они нормально распределены. …

2
Как определить, что остатки автокоррелированы из графики
Когда вы делаете регрессию OLS и строите результирующие остатки, как вы можете определить, являются ли эти остатки автокоррелированными? Я знаю, что есть тесты для этого (Durbin, Breusch-Godfrey), но мне было интересно, можете ли вы просто посмотреть на график, чтобы оценить, может ли автокорреляция быть проблемой (потому что для гетероскедастичности это …

2
Подгонка множественной линейной регрессии в R: автокоррелированные невязки
Я пытаюсь оценить множественную линейную регрессию в R с помощью следующего уравнения: regr <- lm(rate ~ constant + askings + questions + 0) Задания и вопросы представляют собой квартальные временные ряды данных, построенные с помощью askings <- ts(...). Проблема в том, что я получил автокоррелированные остатки. Я знаю, что можно …

1
Как интерпретировать остаточные цвета на мозаичном графике?
Это мозаичный график набора данных таблицы сопряженности, HairEyeColorописанный здесь . Как мне интерпретировать цвета, представляющие остатки? В чем разница между высокими и положительными остатками Пирсона (показаны синим цветом) по сравнению с низкими и отрицательными, показанными красным цветом?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.