Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Есть ли предположение о логистической регрессии?
Есть ли предположение о переменной ответа логистической регрессии? Например, предположим, у нас есть точек данных. Похоже, что ответ исходит из дистрибутива Бернулли с . Следовательно, мы должны иметь распределений Бернулли с другим параметром .Y i p i = логит ( β 0 + β 1 x i ) 1000 р100010001000YiYiY_ipi=logit(β0+β1xi)pi=logit(β0+β1xi)p_i=\text{logit}(\beta_0+\beta_1 …

6
Интуитивное объяснение
Если имеет полный ранг, существует обратное к и мы получаем оценку наименьших квадратов: иХ Т Х β = ( Х Т Х ) - 1 х YXXXXTXXTXX^TXβ^=(XTX)−1XYβ^=(XTX)−1XY\hat\beta = (X^TX)^{-1}XYVar(β^)=σ2(XTX)−1Var⁡(β^)=σ2(XTX)−1\operatorname{Var}(\hat\beta) = \sigma^2(X^TX)^{-1} Как мы можем интуитивно объяснить в формуле дисперсии? Техника деривации для меня понятна.(XTX)−1(XTX)−1(X^TX)^{-1}

4
Почему обычные наименьшие квадраты работают лучше, чем регрессия Пуассона?
Я пытаюсь подогнать регрессию, чтобы объяснить количество убийств в каждом районе города. Хотя я знаю, что мои данные соответствуют распределению Пуассона, я попытался подобрать OLS следующим образом: л о г( у+ 1 ) = α + βИкс+ ϵlog(y+1)=α+βX+ϵlog(y+1) = \alpha + \beta X + \epsilon Затем я также попробовал (конечно!) …

1
Шпаргалка ANOVA Алфавитный суп и регрессивные эквиваленты
Могу ли я получить помощь в завершении этой пробной (находящейся в процессе) попытки получить ориентиры по эквивалентам ANOVA и REGRESSION? Я пытался согласовать понятия, номенклатуру и синтаксис этих двух методологий. На этом сайте есть много сообщений об их общности, например, об этом или об этом , но все же хорошо …

1
Доказательство формулы LOOCV
Из «Введения в статистическое обучение » Джеймса и др., Оценка перекрестной проверки (LOOCV) определяется как где .резюме( н )= 1NΣя = 1NMSEярезюме(N)знак равно1NΣязнак равно1NMSEя\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEя= ( уя- у^я)2MSEязнак равно(Yя-Y^я)2\text{MSE}_i = (y_i-\hat{y}_i)^2 Без доказательства уравнение (5.2) утверждает, что для регрессии наименьших квадратов или полиномиальной регрессии (относится ли это к регрессии …


4
Линейная регрессия с ограничением наклона
Я хочу выполнить очень простую линейную регрессию в R. Формула так же проста, как . Однако я бы хотел, чтобы наклон ( ) находился внутри интервала, скажем, между 1,4 и 1,6.Y= а х + бYзнак равноaИкс+бy = ax + baaa Как это может быть сделано?


4
Определение функции подбора кривой наилучшего соответствия из линейных, экспоненциальных и логарифмических функций
Контекст: Из вопроса об обмене стеками по математике (могу ли я построить программу) кто-то имеет набор точек и хочет подогнать к нему кривую, линейную, экспоненциальную или логарифмическую. Обычный метод состоит в том, чтобы начать с выбора одного из них (который определяет модель), а затем выполнить статистические вычисления.х - уИкс-Yx-y Но …

4
Изменение нулевой гипотезы в линейной регрессии
У меня есть некоторые данные, которые сильно коррелируют. Если я запускаю линейную регрессию, я получаю линию регрессии с наклоном, близким к единице (= 0,93). Что я хотел бы сделать, это проверить, значительно ли отличается этот уклон от 1,0. Я ожидаю, что это не так. Другими словами, я хотел бы изменить …

3
Получение формулы для пределов прогнозирования в линейной модели (т. Е. Интервалы прогнозирования)
Давайте возьмем следующий пример: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Это создает модель y на основе x1 и x2, используя регрессию OLS. Если мы хотим предсказать y для данного x_vec, мы можем просто использовать формулу, которую мы получаем из …

4
Могу ли я просто удалить одну из двух переменных-предикторов, которые имеют высокую линейную корреляцию?
Используя коэффициент корреляции Пирсона, у меня есть несколько переменных, которые сильно коррелированы ( и для 2 пар переменных, которые есть в моей модели).ρ = 0,978ρзнак равно0,978\rho = 0.978ρ = 0,989ρзнак равно0,989\rho = 0.989 Причина , некоторые из переменных имеют высокую корреляцию потому , что одна переменная используется в вычислении для …

3
Как обрабатывать порядковую категориальную переменную как независимую переменную
Я использую модель Logit. Моя зависимая переменная является двоичной. Однако у меня есть независимая переменная , которая является категоричным и содержит ответы: 1.very good, 2.good, 3.average, 4.poor and 5.very poor. Итак, это порядковый номер («количественный категориальный»). Я не уверен, как справиться с этим в модели. Я использую gretl. [Примечание от …

2
Что объясняет добавленный график переменных (график частичной регрессии) в множественной регрессии?
У меня есть модель набора данных Movies, и я использовал регрессию: model <- lm(imdbVotes ~ imdbRating + tomatoRating + tomatoUserReviews+ I(genre1 ** 3.0) +I(genre2 ** 2.0)+I(genre3 ** 1.0), data = movies) library(ggplot2) res <- qplot(fitted(model), resid(model)) res+geom_hline(yintercept=0) Который дал вывод: Теперь я попытался сработать что-то под названием «График добавленной переменной» …

5
По какой причине преобразование журналов используется с искаженными дистрибутивами?
Я однажды слышал, что логарифмическое преобразование является наиболее популярным для правосторонних распределений в линейной регрессии или квантильной регрессии Я хотел бы знать, есть ли причина, лежащая в основе этого утверждения? Почему преобразование журналов подходит для правильного распределения? Как насчет левостороннего распределения?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.