Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

5
Как я могу снять временные ряды?
Как я могу снять временные ряды? Можно ли просто взять первое различие и запустить тест Дики Фуллера, и если он стационарный, у нас все хорошо? В Интернете я также обнаружил, что могу рассчитывать временные ряды, выполняя это в Stata: reg lncredit time predict u_lncredit, residuals twoway line u_lncredit time dfuller …

2
Есть ли причина не использовать ортогональные многочлены при подборе регрессий?
В общем, мне интересно, если там когда-либо лучше не использовать ортогональные полиномы при подборе регрессии с переменными более высокого порядка. В частности, мне интересно с использованием R: Если poly()с raw = FALSEпроизводит то же значение, что и подогнанного poly()с raw = TRUE, и polyс raw = FALSEрешаете некоторые из проблем …

1
Почему R's lm () возвращает оценки коэффициентов, отличные от моего учебника?
Фон Я пытаюсь понять первый пример в курсе по подгонке моделей (так что это может показаться до смешного простым). Я сделал вычисления вручную, и они соответствуют примеру, но когда я повторяю их в R, коэффициенты модели отключены. Я думал, что разница может быть связана с тем, что в учебнике используется …
13 r  regression  self-study  lm 

2
Модельные предположения о регрессии частичных наименьших квадратов (PLS)
Я пытаюсь найти информацию относительно предположений о регрессии PLS (одиночный ). Я особенно заинтересован в сравнении допущений PLS с регрессией OLS. YYy Я прочитал / пролистал много литературы по теме PLS; работы Вольда (Сванте и Германа), Абди и многих других, но не нашли удовлетворительного источника. Wold et al. (2001) PLS-регрессия: …

1
Как масштабировать новые наблюдения для прогнозирования, когда модель снабжена масштабированными данными?
Я понимаю концепцию масштабирования матрицы данных для использования в модели линейной регрессии. Например, в R вы можете использовать: scaled.data <- scale(data, scale=TRUE) Мой единственный вопрос: для новых наблюдений, для которых я хочу предсказать выходные значения, как они правильно масштабируются? Это будет scaled.new <- (new - mean(data)) / std(data)?

1
Почему стандартная ошибка перехвата увеличивается с увеличением
Стандартная ошибка свободного члена ( β 0 ) в у = β 1 х + β 0 + ε задается S E ( β 0 ) 2 = σ 2 [ 1β^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilonSE(β^0)2=σ2[1n+x¯2∑ni=1(xi−x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right] гдеx¯x¯\bar{x}представляет собой среднее изxixix_i«ы. Из того, что я понимаю, SE квантифицирует ваш uncertainty-, например, в 95% …

1
Геометрическая интерпретация обобщенной линейной модели
Для линейной модели y=xβ+ey=xβ+еy=x\beta+e , мы можем иметь хорошую геометрическую интерпретацию расчетной модели с помощью y^знак равноxβ^+e^y^=xβ^+е^\hat{y}=x\hat{\beta}+\hat{e} . У является проекцией у на пространство , натянутое на х и остаточной е перпендикулярна это пространство , натянутое на х.Y^Y^\hat{y}е^е^\hat{e} Теперь мой вопрос: существует ли какая-либо геометрическая интерпретация обобщенной линейной модели (логистическая …

1
Использование MLE против OLS
Когда предпочтительнее использовать оценку максимального правдоподобия вместо обычных наименьших квадратов? Каковы сильные и слабые стороны каждого? Я пытаюсь собрать практические знания о том, где использовать каждый в общих ситуациях.

3
Рассчитать дисперсию, объясняемую каждым предиктором в множественной регрессии, используя R
Я провел множественную регрессию, в которой модель в целом значима и объясняет около 13% дисперсии. Тем не менее, мне нужно найти величину дисперсии, объясняемой каждым значимым предиктором. Как я могу сделать это с помощью R? Вот некоторые примеры данных и кода: D = data.frame( dv = c( 0.75, 1.00, 1.00, …
13 r  regression  variance 


2
Линейная и нелинейная регрессия
У меня есть набор значений и которые теоретически связаны экспоненциально:xxxyyy y=axby=axby = ax^b Одним из способов получения коэффициентов является применение натуральных логарифмов с обеих сторон и подгонка линейной модели: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] Другой способ получить это - использовать нелинейную регрессию, учитывая …

1
При построении регрессионной модели с использованием отдельных наборов моделирования / валидации уместно ли «рециркулировать» данные валидации?
Предположим, у меня есть 80/20 раскол между наблюдениями моделирования / валидации. Я приспособил модель к набору данных моделирования, и меня устраивает ошибка, которую я вижу в наборе данных проверки. Прежде чем развернуть мою модель для оценки будущих наблюдений, уместно ли объединить валидацию с данными моделирования, чтобы получить обновленные оценки параметров …

1
Стандартизированная зависимая переменная в группе в моделях данных панели?
Имеет ли смысл стандартизация зависимой переменной в идентифицирующей группе? В следующем рабочем документе (замедление вырубки лесов в Legal Amazon; цены или политика ?, pdf ) используется стандартизированная зависимая переменная для анализа влияния общих изменений политики в Бразилии на вырубку лесов. Стандартизация осуществляется следующим образом: Yn e wя т= Yя т- …

2
Когда регистрировать / расширять ваши переменные при использовании моделей с произвольным лесом?
Я делаю регрессию, используя случайные леса для прогнозирования цен на основе нескольких атрибутов. Код написан на Python с использованием Scikit-learn. Как вы решаете, должны ли вы преобразовывать свои переменные, используя exp/ logперед тем, как использовать их для соответствия регрессионной модели? Обязательно ли это при использовании ансамблевого подхода, такого как Random …

1
Являются ли уместными стандартные ошибки и доверительные интервалы в регрессиях, где допущение гомоскедастичности нарушено?
Если в стандартных регрессиях OLS нарушаются два предположения (нормальное распределение ошибок, гомоскедастичность), является ли начальная загрузка стандартных ошибок и доверительных интервалов подходящей альтернативой для получения значимых результатов в отношении значимости коэффициентов регрессора? Тесты значимости с загруженными стандартными ошибками и доверительными интервалами все еще работают с гетероскедастичностью? Если да, то какие …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.