Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Предположения наименьших квадратов
Предположим следующую линейную зависимость: , где - зависимая переменная, - одна независимая переменная, а - термин ошибки.Y i X i u iYi=β0+β1Xi+uiYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iYiYiY_iXiXiX_iuiuiu_i Согласно Stock & Watson (Введение в эконометрику; глава 4 ), третье предположение о наименьших квадратах состоит в том, что четвертые моменты …

3
Каковы последствия наличия непостоянной дисперсии в терминах ошибки в линейной регрессии?
Одно из предположений о линейной регрессии состоит в том, что должна быть постоянная дисперсия в терминах ошибок и что доверительные интервалы и проверки гипотез, связанные с моделью, основаны на этом предположении. Что именно происходит, когда члены ошибки не имеют постоянной дисперсии?

2
Означает ли положительный член взаимодействия корреляцию между составляющими его переменными?
Допустим, я запускаю линейную регрессию, которая имеет вид .y=β0+β1A+β2B+β3AB+ϵy=β0+β1A+β2B+β3AB+ϵy = \beta_0 + \beta_1A+\beta_2B+\beta_3AB +\epsilon Если положительно, означает ли это положительную корреляцию между A и B ? (И наоборот, отрицательная корреляция, если \ beta_3 отрицательна?)β3β3\beta_3AAABBBβ3β3\beta_3

2
Разрешено ли использовать средние значения для набора данных для улучшения корреляции?
У меня есть набор данных с зависимой и независимой переменной. Оба не временные ряды. У меня 120 наблюдений. Коэффициент корреляции составляет 0,43. После этого расчета я добавил столбец для обеих переменных со средним значением для каждых 12 наблюдений, в результате чего появилось 2 новых столбца с 108 наблюдениями (парами). Коэффициент …

2
Регрессия на единичном диске, начиная с «равномерно расположенных» выборок
Мне нужно решить сложную проблему регрессии на диске устройства. Оригинальный вопрос вызвал некоторые интересные комментарии, но, к сожалению, ответов нет. Тем временем я узнал кое-что еще об этой проблеме, поэтому я постараюсь разбить исходную проблему на подзадачи и посмотреть, повезет ли мне в этот раз. У меня 40 датчиков температуры, …

1
Как линейный базовый ученик работает в повышении? И как это работает в библиотеке xgboost?
Я знаю, как реализовать линейную целевую функцию и линейные усиления в XGBoost. Мой конкретный вопрос: когда алгоритм соответствует остаточному (или отрицательному градиенту), использует ли он один элемент на каждом шаге (т.е. одномерную модель) или все признаки (многомерная модель)? Будем благодарны за любые ссылки на документацию о линейных бустах в XGBoost. …

1
Можно ли использовать стандартизированные
Я пытаюсь интерпретировать результаты статьи, где они применили множественную регрессию, чтобы предсказать различные результаты. Однако 's (стандартизированные коэффициенты B определены как β x 1 = B x 1 ⋅ S D x 1ββ\beta гдеy- зависимая переменная, аx1- предиктор), по-видимому, не соответствует сообщенномуR2:βИкс1= BИкс1⋅ S DИкс1S DYβx1=Bx1⋅SDx1SDy\beta_{x_1} = B_{x_1} \cdot \frac{\mathrm{SD}_{x_1}}{\mathrm{SD}_y}YyyИкс1x1x_1р2R2R^2 …

2
Как рассчитать доверительный интервал X-перехвата в линейной регрессии?
Поскольку стандартная ошибка линейной регрессии обычно задается для переменной отклика, мне интересно, как получить доверительные интервалы в другом направлении - например, для x-перехвата. Я могу представить, что это может быть, но я уверен, что должен быть прямой способ сделать это. Ниже приведен пример того, как R визуализировать это: set.seed(1) x …

1
Определение весов наименьших квадратов: функция R lm против
Может кто-нибудь сказать мне, почему я получаю разные результаты от Rвзвешенных наименьших квадратов и ручного решения с помощью матричной операции ? В частности, я пытаюсь вручную решить , где - диагональная матрица весов, - матрица данных, - ответ вектор. W A bWAx=WbWAx=Wb\mathbf W \mathbf A\mathbf x=\mathbf W \mathbf bWW\mathbf WAA\mathbf …

1
Что обычного, в обычных наименьших квадратах?
Мой друг недавно спросил, что же такого обычного, в отношении наименьших квадратов. Похоже, мы ни к чему не привели в обсуждении. Мы оба согласились, что OLS является частным случаем линейной модели, она имеет много применений, хорошо известна и является частным случаем многих других моделей. Но действительно ли это все? Поэтому …

2
Присвоение большего веса более поздним наблюдениям регрессии
Как мне придать больший вес более поздним наблюдениям в R? Я предполагаю, что это часто задаваемый вопрос или желание, но мне трудно понять, как именно это реализовать. Я пытался много искать для этого, но я не могу найти хороший практический пример. В моем примере у меня будет большой набор данных …

2
Почему информационный критерий (не скорректированный
В моделях временных рядов, таких как ARMA-GARCH, для выбора подходящего лага или порядка модели используются разные информационные критерии, такие как AIC, BIC, SIC и т. Д. Мой вопрос очень прост, почему мы не используем скорректированный чтобы выбрать подходящую модель? Мы можем выбрать модель, которая приведет к более высокому значению скорректированной …

2
В чем разница между этими двумя тестами Бреуша-язычества?
Используя R на некоторых данных и пытаясь определить , являются ли мои данные гетероскедастичными, я нашел две реализации теста Бреуша -Пагана: bptest (package lmtest) и ncvTest (package car). Однако они дают разные результаты. Какая разница между двумя? Когда вы должны использовать один или другой? > model <- lm(y ~ x) …

1
Пространство данных, пространство переменных, пространство наблюдения, пространство модели (например, в линейной регрессии)
Предположим, у нас есть матрица данных , которая является n- by- , и вектор метки , который является by-one. Здесь каждая строка матрицы является наблюдением, а каждый столбец соответствует измерению / переменной. (предположим, что )XX\mathbf{X}nnnУ нpppYYYnnnn>pn>pn>p Тогда что data space, variable space, observation space, model spaceзначит? Пространство, охваченное вектором столбца, …

4
Интерпретация значения AIC
Типичные значения AIC, которые я видел для логистических моделей, исчисляются тысячами, по меньшей мере, сотнями. например, на http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ AIC составляет 727,39 Хотя всегда говорят, что AIC следует использовать только для сравнения моделей, я хотел понять, что означает конкретное значение AIC. По формуле А яС= - 2 журнала( L ) + …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.