Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Почему ошибка измерения в зависимой переменной не влияет на результаты?
Когда есть ошибка измерения в независимой переменной, я понял, что результаты будут смещены против 0. Когда зависимая переменная измерена с ошибкой, они говорят, что это просто влияет на стандартные ошибки, но это не имеет большого смысла для меня, потому что мы оценка влияния не на исходную переменную а на некоторую …

4
Почему бы не преобразовать в лог все переменные, которые не представляют основного интереса?
В книгах и дискуссиях часто утверждается, что при возникновении проблем (из которых есть несколько) с предиктором, log-transformimg это возможно. Теперь я понимаю, что это зависит от распределений, и нормальность в предикторах не является предположением о регрессии; но преобразование журнала делает данные более однородными, меньше подверженными выбросам и так далее. Я …

2
Регрессия с обратной независимой переменной
Предположим, у меня есть вектор зависимых переменных и вектор независимой переменной. Когда отображается на графике , я вижу, что между ними существует линейная зависимость (восходящая тенденция). Теперь это также означает, что между и существует линейная тенденция к снижению .NNNYYYNNNXXXYYY1X1X\frac{1}{X}YYYXXX Теперь, если я запускаю регрессию: и получаю подходящее значениеY=β∗X+ϵY=β∗X+ϵY = \beta …

2
Вмешательство с дифференцированием
При проведении анализа вмешательства с данными временного ряда (также известного как Прерванный временной ряд), как обсуждалось здесь, например, одно из требований, которое у меня есть, - оценить общий выигрыш (или убыток) от вмешательства - то есть количество единиц, полученных или потерянных (переменная Y ). Не совсем понимая, как оценивать функцию …

3
Возможно ли в R (или вообще) заставить коэффициенты регрессии быть определенным знаком?
Я работаю с некоторыми реальными данными, и регрессионные модели дают противоречивые результаты. Обычно я доверяю статистике, но на самом деле некоторые из этих вещей не могут быть правдой. Основная проблема, которую я вижу, состоит в том, что увеличение одной переменной вызывает увеличение отклика, когда на самом деле они должны иметь …

2
Эквивалентность выборочной корреляции и R-статистики для простой линейной регрессии
Часто утверждается, что квадрат выборочной корреляции эквивалентен коэффициенту определения для простой линейной регрессии. Я не смог продемонстрировать это сам и был бы признателен за полное доказательство этого факта.r2r2r^2R2R2R^2

1
Почему не нормально распределенные ошибки ставят под угрозу достоверность наших утверждений о значимости?
При рассмотрении моделей OLS существует предположение о нормальности, а именно то, что ошибки распределяются нормально. Я просматривал Cross Validated, и кажется, что Y и X не должны быть нормальными, чтобы ошибки были нормальными. Мой вопрос заключается в том, почему, когда у нас есть ошибки, которые обычно не распределяются, действительность наших …

1
Коэффициент дисперсии инфляции для обобщенных аддитивных моделей
В обычном расчете VIF для линейной регрессии каждая независимая / пояснительная переменная рассматривается как зависимая переменная в обычной регрессии наименьших квадратов. т.е.ИксJXjX_j ИксJ= β0+ ∑я = 1 , я ≠ jNβяИксяИксJзнак равноβ0+Σязнак равно1,я≠JNβяИкся X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i Значения сохраняются для каждой из регрессий, а …

1
Fit GARCH (1,1) - модель с ковариатами в R
У меня есть некоторый опыт моделирования временных рядов, в виде простых моделей ARIMA и так далее. Теперь у меня есть некоторые данные, которые показывают кластеризацию волатильности, и я хотел бы попытаться начать с подгонки модели GARCH (1,1) к данным. У меня есть ряд данных и ряд переменных, которые, я думаю, …
10 r  regression  garch 

1
Оцениваете производительность регрессионной модели с использованием обучающих и тестовых наборов?
Я часто слышу об оценке эффективности модели классификации, проводя тестовый набор и обучая модель на тренировочном наборе. Затем создаем 2 вектора, один для прогнозируемых значений и один для истинных значений. Очевидно, что сравнение позволяет судить о производительности модели по ее прогнозирующей способности, используя такие вещи, как F-Score, Kappa Statistic, Precision …

1
В чем принципиальная разница между этими двумя регрессионными моделями?
Предположим, у меня есть двумерные ответы со значительной корреляцией. Я пытаюсь сравнить два способа моделирования этих результатов. Один из способов - смоделировать разницу между двумя результатами: Другой способ - использовать или смоделировать их: (yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) Вот пример foo: #create foo data frame require(mvtnorm) require(reshape) set.seed(123456) sigma <- matrix(c(4,2,2,3), ncol=2) y <- …

2
Робастный регрессионный вывод и сэндвич-оценки
Можете ли вы дать мне пример использования сэндвич-оценок для выполнения надежного регрессионного вывода? Я могу видеть пример ?sandwich, но я не совсем понимаю, как мы можем перейти от lm(a ~ b, data)( r- кодированного) к оценке и к значению p, полученному в результате регрессионной модели с использованием матрицы дисперсии-ковариации, возвращаемой …
10 r  regression  lm  sandwich 

3
Сравнение вложенных бинарных моделей логистической регрессии, когда большое
Чтобы лучше задать мой вопрос, я предоставил некоторые из выводов как из 16 переменных моделей ( fit), так и из 17 переменных моделей ( fit2) ниже (все предикторные переменные в этих моделях являются непрерывными, где единственное различие между этими моделями состоит в том, fitчто содержит переменную 17 (var17)): fit Model …

3
Путаница, связанная с эластичной сеткой
Я читал эту статью, связанную с эластичной сеткой. Они говорят, что они используют эластичную сеть, потому что, если мы просто используем Лассо, это имеет тенденцию выбирать только один предиктор среди предикатов, которые сильно коррелируют. Но разве это не то, что мы хотим. Я имею в виду, что это избавляет нас …

4
Является ли регрессия x на y явно лучше, чем y на x в этом случае?
Прибор, используемый для измерения уровня глюкозы в крови человека, контролируется на случайной выборке из 10 человек. Уровни также измеряются с использованием очень точной лабораторной процедуры. Мера инструмента обозначается х. Мера лабораторной процедуры обозначается у. Я лично считаю, что y на x более правильное, потому что намерение состоит в том, чтобы …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.