Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Коэффициент экспоненциальной логистической регрессии отличается от отношения шансов
Насколько я понимаю, возведенное в степень значение бета из логистической регрессии - это отношение шансов этой переменной для зависимой переменной, представляющей интерес. Однако это значение не соответствует рассчитанному вручную коэффициенту шансов. Моя модель предсказывает задержку роста (показатель недоедания) с использованием, среди прочего, страховки. // Odds ratio from LR, being done …

4
Зачем использовать контрольные переменные в различиях?
У меня есть вопрос о подходе «различия в различиях» со следующим стандартным уравнением: где Treat - фиктивная переменная для группы лечения и post. y=a+b1treat+b2post+b3treat⋅post+uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Теперь мой вопрос прост: почему в большинстве статей все еще используются дополнительные контрольные переменные? Я думал, что …

2
Лучший способ объединить двоичный и непрерывный ответ
Я пытаюсь найти лучший способ предсказать сумму платежа для агентства по сбору платежей. Зависимая переменная отлична от нуля только тогда, когда был произведен платеж. Понятно, что существует огромное количество нулей, потому что большинство людей не могут быть достигнуты или не могут погасить долг. Существует также очень сильная отрицательная корреляция между …

1
Есть ли обобщение следа Пиллая и следа Хотеллинга-Лоули?
В условиях многомерной множественной регрессии (векторный регрессор и регрессия) четыре основных критерия общей гипотезы (лямбда Вилка, Пиллаи-Бартлетт, Хотеллинг-Лоули и самый большой корень Роя) зависят от собственных значений матрицы , где H и E - «объясненная» и «общая» вариационные матрицы.HE−1HE−1H E^{-1}HHHEEE Я заметил , что ПИЛЛАИ и Хотеллинг-Lawley статистические данные могут …

2
Регуляризация нормы и нормы эмпирического исследования
Существует много способов выполнения регуляризации - например, регуляризация на основе норм , и . Согласно Friedman Hastie & Tibsharani , лучший регуляризатор зависит от проблемы: а именно от природы истинной целевой функции, конкретной используемой основы, отношения сигнал / шум и размера выборки.L0L0L_0L1L1L_1L2L2L_2 Есть ли эмпирические исследования, сравнивающие методы и эффективность …

3
Остатки для логистической регрессии и расстояния Кука
Существуют ли какие-либо особые предположения относительно ошибок логистической регрессии, такие как постоянная дисперсия слагаемых ошибок и нормальность остатков? Также обычно, когда у вас есть точки, у которых расстояние Кука больше 4 / n, вы их удаляете? Если вы удалите их, как вы можете определить, лучше ли модель с удаленными точками?

1
Являются ли регрессии с ошибками Student-T бесполезными?
Пожалуйста, смотрите редактировать. Когда у вас есть данные с тяжелыми хвостами, выполнение регрессии с ошибками Student-T кажется интуитивно понятным. Исследуя эту возможность, я наткнулся на эту статью: Breusch, TS, Robertson, JC, & Welsh, AH (01 ноября 1997 г.). Новая одежда императора: критика многомерной регрессионной модели. Statistica Neerlandica, 51, 3.) ( …

2
Стабильность модели в перекрестной проверке регрессионных моделей
С учетом множественных сгибов перекрестной проверки логистической регрессии и полученных в результате множественных оценок каждого коэффициента регрессии, как следует измерить, является ли предиктор (или набор предикторов) стабильным и значимым на основе коэффициента (ов) регрессии ? Отличается ли это для линейной регрессии?

2
Как выбрать лучшее преобразование для достижения линейности?
Я хочу сделать множественную линейную регрессию, а затем предсказать новые значения с небольшой экстраполяцией. У меня есть переменная ответа в диапазоне от -2 до +7 и три предиктора (диапазоны от +10 до +200). Распределение почти нормальное. Но отношения между ответом и предикторами не являются линейными, я вижу кривые на графиках. …

3
Линейная модель Гетероскедастичность
У меня есть следующая линейная модель: журнал( Y+ 1 )log⁡(Y+1)\log(Y + 1) > summary(Y) Min. :-0.0005647 1st Qu.: 0.0001066 Median : 0.0003060 Mean : 0.0004617 3rd Qu.: 0.0006333 Max. : 0.0105730 NA's :30.0000000 Как я могу преобразовать переменные, чтобы улучшить ошибку и дисперсию предсказания, особенно для крайних правых значений?

2
Как выполнить регрессию гауссовского процесса, когда аппроксимируемая функция изменяется со временем?
Каковы хорошие стратегии для выполнения регрессии гауссовского процесса, когда функция, которую я пытаюсь приблизить, изменяется во времени? Наивный подход, который приходит мне в голову, состоит в том, чтобы использовать только N самых последних точек данных для выполнения регрессии. Какие стратегии лучше?

3
Почему существует значение R ^ 2 (и что его определяет), когда lm не имеет дисперсии в прогнозируемом значении?
Рассмотрим следующий код R: example <- function(n) { X <- 1:n Y <- rep(1,n) return(lm(Y~X)) } #(2.13.0, i386-pc-mingw32) summary(example(7)) #R^2 = .1963 summary(example(62)) #R^2 = .4529 summary(example(4540)) #R^2 = .7832 summary(example(104))) #R^2 = 0 #I did a search for n 6:10000, the result for R^2 is NaN for #n = …
10 r  regression 

4
Как интерпретировать логарифмически преобразованные коэффициенты в линейной регрессии?
Моя ситуация такова: У меня есть 1 непрерывная зависимая и 1 непрерывная предикторная переменная, которую я логарифмически преобразовал, чтобы нормализовать их остатки для простой линейной регрессии. Буду признателен за любую помощь в том, как я могу связать эти преобразованные переменные с их исходным контекстом. Я хочу использовать линейную регрессию, чтобы …

4
Вывод LaTeX для объекта R Summary.lm - при отображении информации вне таблицы [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 3 года назад . Это казалось мне базовым, но я не могу найти решение онлайн, поэтому я подумал, что мне не хватает. Я …
10 r  regression 

2
Когда использовать распределение Стьюдента или Нормального в линейной регрессии?
Я смотрю на некоторые проблемы, а в некоторых, чтобы проверить коэффициенты, иногда я вижу людей, использующих распределение Стьюдента, а иногда я вижу Нормальное распределение. Какое правило?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.