Статистика и большие данные regression

2

Предположим следующую линейную зависимость: , где - зависимая переменная, - одна независимая переменная, а - термин ошибки.Y i X i u iYi=β0+β1Xi+uiYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iYiYiY_iXiXiX_iuiuiu_i Согласно Stock & Watson (Введение в эконометрику; глава 4 ), третье предположение о наименьших квадратах состоит в том, что четвертые моменты …

9 regression least-squares assumptions bias consistency

3

Каковы последствия наличия непостоянной дисперсии в терминах ошибки в линейной регрессии?

Одно из предположений о линейной регрессии состоит в том, что должна быть постоянная дисперсия в терминах ошибок и что доверительные интервалы и проверки гипотез, связанные с моделью, основаны на этом предположении. Что именно происходит, когда члены ошибки не имеют постоянной дисперсии?

9 regression heteroscedasticity assumptions robust-standard-error

2

Означает ли положительный член взаимодействия корреляцию между составляющими его переменными?

Допустим, я запускаю линейную регрессию, которая имеет вид .y=β0+β1A+β2B+β3AB+ϵy=β0+β1A+β2B+β3AB+ϵy = \beta_0 + \beta_1A+\beta_2B+\beta_3AB +\epsilon Если положительно, означает ли это положительную корреляцию между A и B ? (И наоборот, отрицательная корреляция, если \ beta_3 отрицательна?)β3β3\beta_3AAABBBβ3β3\beta_3

9 regression interaction

2

Разрешено ли использовать средние значения для набора данных для улучшения корреляции?

У меня есть набор данных с зависимой и независимой переменной. Оба не временные ряды. У меня 120 наблюдений. Коэффициент корреляции составляет 0,43. После этого расчета я добавил столбец для обеих переменных со средним значением для каждых 12 наблюдений, в результате чего появилось 2 новых столбца с 108 наблюдениями (парами). Коэффициент …

9 regression correlation mean predictor cross-section

2

Регрессия на единичном диске, начиная с «равномерно расположенных» выборок

Мне нужно решить сложную проблему регрессии на диске устройства. Оригинальный вопрос вызвал некоторые интересные комментарии, но, к сожалению, ответов нет. Тем временем я узнал кое-что еще об этой проблеме, поэтому я постараюсь разбить исходную проблему на подзадачи и посмотреть, повезет ли мне в этот раз. У меня 40 датчиков температуры, …

9 regression spatial circular-statistics

1

Как линейный базовый ученик работает в повышении? И как это работает в библиотеке xgboost?

Я знаю, как реализовать линейную целевую функцию и линейные усиления в XGBoost. Мой конкретный вопрос: когда алгоритм соответствует остаточному (или отрицательному градиенту), использует ли он один элемент на каждом шаге (т.е. одномерную модель) или все признаки (многомерная модель)? Будем благодарны за любые ссылки на документацию о линейных бустах в XGBoost. …

9 regression machine-learning boosting xgboost

1

Можно ли использовать стандартизированные

Я пытаюсь интерпретировать результаты статьи, где они применили множественную регрессию, чтобы предсказать различные результаты. Однако 's (стандартизированные коэффициенты B определены как β x 1 = B x 1 ⋅ S D x 1ββ\beta гдеy- зависимая переменная, аx1- предиктор), по-видимому, не соответствует сообщенномуR2:βИкс1= BИкс1⋅ S DИкс1S DYβx1=Bx1⋅SDx1SDy\beta_{x_1} = B_{x_1} \cdot \frac{\mathrm{SD}_{x_1}}{\mathrm{SD}_y}YyyИкс1x1x_1р2R2R^2 …

9 regression regression-coefficients multicollinearity r-squared

2

Как рассчитать доверительный интервал X-перехвата в линейной регрессии?

Поскольку стандартная ошибка линейной регрессии обычно задается для переменной отклика, мне интересно, как получить доверительные интервалы в другом направлении - например, для x-перехвата. Я могу представить, что это может быть, но я уверен, что должен быть прямой способ сделать это. Ниже приведен пример того, как R визуализировать это: set.seed(1) x …

9 r regression confidence-interval bootstrap

1

Определение весов наименьших квадратов: функция R lm против

Может кто-нибудь сказать мне, почему я получаю разные результаты от Rвзвешенных наименьших квадратов и ручного решения с помощью матричной операции ? В частности, я пытаюсь вручную решить , где - диагональная матрица весов, - матрица данных, - ответ вектор. W A bWAx=WbWAx=Wb\mathbf W \mathbf A\mathbf x=\mathbf W \mathbf bWW\mathbf WAA\mathbf …

9 r regression least-squares weighted-regression weighted-data

1

Что обычного, в обычных наименьших квадратах?

Мой друг недавно спросил, что же такого обычного, в отношении наименьших квадратов. Похоже, мы ни к чему не привели в обсуждении. Мы оба согласились, что OLS является частным случаем линейной модели, она имеет много применений, хорошо известна и является частным случаем многих других моделей. Но действительно ли это все? Поэтому …

9 regression linear-model least-squares terminology

2

Присвоение большего веса более поздним наблюдениям регрессии

Как мне придать больший вес более поздним наблюдениям в R? Я предполагаю, что это часто задаваемый вопрос или желание, но мне трудно понять, как именно это реализовать. Я пытался много искать для этого, но я не могу найти хороший практический пример. В моем примере у меня будет большой набор данных …

9 r time-series regression random-forest

2

Почему информационный критерий (не скорректированный

В моделях временных рядов, таких как ARMA-GARCH, для выбора подходящего лага или порядка модели используются разные информационные критерии, такие как AIC, BIC, SIC и т. Д. Мой вопрос очень прост, почему мы не используем скорректированный чтобы выбрать подходящую модель? Мы можем выбрать модель, которая приведет к более высокому значению скорректированной …

9 regression time-series model-selection aic bic

2

В чем разница между этими двумя тестами Бреуша-язычества?

Используя R на некоторых данных и пытаясь определить , являются ли мои данные гетероскедастичными, я нашел две реализации теста Бреуша -Пагана: bptest (package lmtest) и ncvTest (package car). Однако они дают разные результаты. Какая разница между двумя? Когда вы должны использовать один или другой? > model <- lm(y ~ x) …

9 r regression heteroscedasticity assumptions breusch-pagan

1

Пространство данных, пространство переменных, пространство наблюдения, пространство модели (например, в линейной регрессии)

Предположим, у нас есть матрица данных , которая является n- by- , и вектор метки , который является by-one. Здесь каждая строка матрицы является наблюдением, а каждый столбец соответствует измерению / переменной. (предположим, что )XX\mathbf{X}nnnУ нpppYYYnnnn>pn>pn>p Тогда что data space, variable space, observation space, model spaceзначит? Пространство, охваченное вектором столбца, …

9 regression multiple-regression terminology geometry biplot

4

Интерпретация значения AIC

Типичные значения AIC, которые я видел для логистических моделей, исчисляются тысячами, по меньшей мере, сотнями. например, на http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ AIC составляет 727,39 Хотя всегда говорят, что AIC следует использовать только для сравнения моделей, я хотел понять, что означает конкретное значение AIC. По формуле А яС= - 2 журнала( L ) + …

9 regression model-selection aic accuracy

Вопросы с тегом «regression»