Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

1
Вопрос о том, как нормализовать коэффициент регрессии
Не уверен, что слово «нормализация» - это правильное слово, но я постараюсь сделать все возможное, чтобы проиллюстрировать то, что я пытаюсь спросить. Здесь используется оценка наименьших квадратов. Предположим, у вас есть y = β 0 + β 1 x 1y=β0+β1x1y=\beta_0+\beta_1x_1 , вы можете центрировать его вокруг среднего значения y = …

2
Меры остаточной гетероскедастичности
Эта ссылка на Википедию перечисляет ряд методов для определения гетероскедастичности остатков МНК. Я хотел бы узнать, какой практический метод более эффективен в обнаружении областей, затронутых гетероскедастичностью. Например, здесь видно, что центральная область на графике OLS «Остаточные и адаптированные» имеет более высокую дисперсию, чем стороны графика (я не совсем уверена в …

3
Можно ли вообще рассортировать набор данных по размеру остатка и провести сравнение с двумя выборками?
Это то, что я вижу в качестве специального метода, и это мне кажется очень подозрительным, но, возможно, я что-то упустил. Я видел, как это делалось в множественной регрессии, но давайте просто сделаем это просто: yi=β0+β1xi+εiyi=β0+β1xi+εi y_{i} = \beta_{0} + \beta_{1} x_{i} + \varepsilon_{i} Теперь возьмите остатки от установленной модели ei=yi−(β^0+β^1xi)ei=yi−(β^0+β^1xi) …


2
Является ли хорошей практикой стандартизировать ваши данные в регрессии с панельными / продольными данными?
В общем, я стандартизирую свои независимые переменные в регрессиях, чтобы правильно сравнить коэффициенты (таким образом, они имеют одинаковые единицы: стандартные отклонения). Однако с панельными / продольными данными я не уверен, как мне следует стандартизировать мои данные, особенно если я оцениваю иерархическую модель. Чтобы понять, почему это может быть потенциальной проблемой, …

2
Агрегирование результатов прогонов линейной модели R
Поскольку регрессионное моделирование часто является больше «искусством», чем наукой, я часто проверяю множество итераций регрессионной структуры. Каковы некоторые эффективные способы суммирования информации из этих множественных прогонов модели в попытке найти «лучшую» модель? Один из подходов, который я использовал, - это поместить все модели в список и просмотреть summary()этот список, но …
16 r  regression 

1
Подходящие модели в R, где коэффициенты подчиняются линейным ограничениям
Как определить формульную формулу в R, когда доступно одно (или несколько) точных линейных ограничений, связывающих коэффициенты. В качестве примера, скажем, что вы знаете, что b1 = 2 * b0 в простой модели линейной регрессии. Спасибо!
16 r  regression  modeling 

1
Логистическая регрессия - проблемы мультиколлинеарности / ловушки
В Логистической регрессии, нужно ли заботиться о мультиколлинеарности так же, как если бы вы были в прямой регрессии МНК? Например, в случае логистической регрессии, когда существует мультиколлинеарность, нужно ли вам быть осторожным (как в случае регрессии МНК) с выводом из бета-коэффициентов? Для регрессии МНК одним «исправлением» высокой мультиколлинеарности является регрессия …

1
Высокомерная регрессия: почему
Я пытаюсь прочитать об исследованиях в области регрессии больших размеров; когда больше , то есть . Похоже, термин часто встречается в терминах скорости сходимости для оценок регрессии.pppnnnp>>np>>np >> nlogp/nlog⁡p/n\log p/n Например, здесь уравнение (17) говорит, что для подгонки лассо удовлетворяет β^β^\hat{\beta}1n∥Xβ^−Xβ∥22=OP(σlogpn−−−−−√∥β∥1).1n‖Xβ^−Xβ‖22=OP(σlog⁡pn‖β‖1). \dfrac{1}{n}\|X\hat{\beta} - X \beta\|_2^2 = O_P \left(\sigma \sqrt{\dfrac{\log p}{n} …

3
Какова связь между бета-распределением и моделью логистической регрессии?
Мой вопрос: какова математическая связь между распределением Бета и коэффициентами модели логистической регрессии ? Для иллюстрации: логистическая (сигмоидальная) функция задается f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} и он используется для моделирования вероятностей в модели логистической регрессии. Пусть AAA - дихотомический (0,1)(0,1)(0,1) результат, а XXX - матрица дизайна. Модель логистической регрессии задается P(A=1|X)=f(Xβ).P(A=1|X)=f(Xβ).P(A=1|X) = …

1
Какова связь между частичными наименьшими квадратами, регрессией пониженного ранга и регрессией главных компонент?
Являются ли регрессия с пониженным рангом и регрессия главных компонентов просто частными случаями частичных наименьших квадратов? В этом руководстве (Страница 6, «Сравнение целей») утверждается, что когда мы делаем частичные наименьшие квадраты без проецирования X или Y (то есть «не частичные»), оно становится соответственно уменьшенной ранговой регрессией или регрессией главных компонент. …

4
Почему мы говорим, что переменная результата «регрессирует» на предиктор (ы)?
Есть ли интуитивное объяснение этой терминологии? Почему это так, а не предсказатель (ы) регрессируют на результат? В идеале я надеюсь, что правильное объяснение того, почему существует эта терминология, поможет студентам запомнить ее и помешать им сказать это неправильно.

1
Как смоделировать неотрицательные данные с нулевой раздувкой?
В настоящее время я пытаюсь применить линейную модель ( family = gaussian) к индикатору биоразнообразия, который не может принимать значения ниже нуля, имеет нулевое раздувание и непрерывен. Значения варьируются от 0 до чуть более 0,25. Как следствие, в остатках модели есть довольно очевидная закономерность, от которой мне не удалось избавиться: …

3
Дискриминантный анализ против логистической регрессии
Я нашел некоторые плюсы дискриминантного анализа, и у меня есть вопросы о них. Так: Когда классы хорошо разделены, оценки параметров для логистической регрессии удивительно нестабильны. Коэффициенты могут уходить в бесконечность. LDA не страдает от этой проблемы. Если число признаков мало и распределение предикторов ИксИксX приблизительно нормальное в каждом из классов, …

1
Почему «расслабленное лассо» отличается от стандартного лассо?
Если мы начнем с набора данных , применим к нему Лассо и получим решение , мы можем снова применить Лассо к набору данных , где - это набор ноль индексов , чтобы получить решение, , называемое «расслабленным решением LASSO» (поправьте меня, если я ошибаюсь!). Решение должно удовлетворять условиям Каруша-Куна-Такера (KKT) …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.