Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

4
Логистическая регрессия и точка перегиба
У нас есть данные с двоичным результатом и некоторыми ковариатами. Я использовал логистическую регрессию для моделирования данных. Просто простой анализ, ничего необычного. Предполагается, что конечным результатом будет кривая доза-эффект, где мы показываем, как изменяется вероятность для конкретного ковариата. Что-то вроде этого: Мы получили некоторую критику от внутреннего рецензента (не чисто …

1
Почему диагностика основана на остатках?
В простой линейной регрессии часто требуется проверить, выполнены ли определенные допущения, чтобы можно было сделать вывод (например, остатки обычно распределяются). Целесообразно ли проверять допущения, проверяя, нормально ли распределены установленные значения?

1
Результаты регрессии хребта отличаются при использовании lm.ridge и glmnet
Я применил некоторые данные, чтобы найти лучшее решение переменных регрессионной модели с использованием регрессии гребня в R. Я использовал lm.ridgeи glmnet(когда alpha=0), но результаты сильно отличаются, особенно когда lambda=0. Предполагается, что оба оценщика параметров имеют одинаковые значения. Итак, в чем здесь проблема? наилучшие пожелания

1
Выборочное распределение коэффициентов регрессии
Ранее я узнал о распределениях выборки, которые дали результаты, которые были для оценки, с точки зрения неизвестного параметра. Например, для выборочных распределений и в модели линейной регрессии β 1Уя=βо+β1Xя+εяβ^0β^0\hat\beta_0β^1β^1\hat\beta_1Yя= βо+ β1Икся+ εяYязнак равноβо+β1Икся+εяY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼ N(β0, σ2(1n+x¯2Sxx))β^0∼N(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) и …

2
Что такое хорошая визуализация для пуассоновских регрессий?
Я хочу связать дефекты кода с такими показателями сложности кода, как близость. Одна из распространенных моделей состоит в том, чтобы рассматривать это как процесс Пуассона, где продолжительность - это то, сколько времени затрачивается на кодирование, а плотность - это функция сложности кода. Я могу сделать регрессию и получить значения значимости …

5
Что делать с коллинеарными переменными
Отказ от ответственности: это для домашнего проекта. Я пытаюсь найти лучшую модель для цен на алмазы, в зависимости от нескольких переменных, и у меня пока что есть довольно хорошая модель. Однако я столкнулся с двумя переменными, которые явно коллинеарны: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 …

2
В чем преимущество уменьшения размерности предикторов для целей регрессии?
Каковы применения или преимущества методов регрессии с уменьшением размерности (DRR) или контролируемого уменьшения размерности (SDR) по сравнению с традиционными методами регрессии (без уменьшения размерности)? Этот класс методов находит низкоразмерное представление набора функций для задачи регрессии. Примеры таких методов включают в себя секвированную обратную регрессию, главные гессианские направления, оценку средней дисперсии …

1
Как зафиксировать коэффициент в порядковой логистической регрессии без предположения пропорциональных шансов в R?
Я хочу сделать порядковую логистическую регрессию в R без предположения о вероятности пропорциональности. Я знаю, что это можно сделать напрямую, используя vglm()функцию в Rнастройках parallel=FALSE. Но моя проблема в том, как исправить определенный набор коэффициентов в этой настройке регрессии? Например, допустим, что зависимая переменная является дискретной и порядковой и может …
11 r  regression  logistic 

4
Есть ли тест для пропущенного смещения переменной в OLS?
Мне известен тест «Сброс Рамси», который может обнаружить нелинейные зависимости. Однако, если вы просто выбрасываете один из коэффициентов регрессии (просто линейные зависимости), вы можете получить смещение в зависимости от корреляций. Это явно не обнаружено тестом сброса. Я не нашел тест для этого случая, но это утверждение: «Вы не можете проверить …

4
Как осмыслить ошибку в регрессионной модели?
Я посещаю занятия по анализу данных, и некоторые из моих укоренившихся идей потрясены. А именно, идея о том, что ошибка (эпсилон), как и любой другой вид дисперсии, применима только (как я думал) к группе (выборке или целому населению). Теперь нас учат, что одним из допущений регрессии является то, что дисперсия …

2
Регрессия, основанная, например, на днях недели
Мне нужна небольшая помощь, чтобы двигаться в правильном направлении. Прошло много времени с тех пор, как я изучал статистику, и, похоже, жаргон изменился. Представьте, что у меня есть набор данных, связанных с автомобилем, таких как Время в пути от города А до города Б Расстояние от города А до города …

2
Возможные расширения диагностических участков по умолчанию для lm (в R и в целом)?
Я начал немного копаться в функции plot.lm , эта функция дает шесть графиков для lm: График остатков от установленных значений График Scale-Location для sqrt (| остатки |) по отношению к подобранным значениям Нормальный график QQ, график расстояний Кука против меток строк График остатков против рычагов график расстояний Кука от плеча …

1
Какие прогнозируемые значения возвращаются функцией предиката () в R при использовании исходных данных в качестве входных данных?
После запуска регрессии формы reg <- lm(y ~ x1 + x2, data=example)в наборе данных, я могу получить прогнозируемые значения, используя predict(reg, example, interval="prediction", level=0.95) Мне интересно, что на самом деле относятся к прогнозируемым значениям, когда я использую регрессию для прогнозирования фактического набора данных. Я не должен получить исходные значения?
11 r  regression 

2
Правильное использование и интерпретация моделей с нулевой раздувкой
Фон: я биостатист, в настоящее время борюсь с набором данных о клеточной экспрессии. В ходе исследования некоторые пептиды подвергались воздействию множества клеток, собранных группами от различных доноров. Клетки либо экспрессируют определенные биомаркеры в ответ, либо нет. Частота ответов затем записывается для каждой группы доноров. Частота ответов (выраженная в процентах) является …

7
Имеет ли смысл изучать графики невязок относительно зависимой переменной?
Я хотел бы знать, имеет ли смысл изучать графики невязок относительно зависимой переменной, когда я получаю одномерную регрессию. Если это имеет смысл, что означает сильная линейная растущая корреляция между остатками (по оси Y) и оценочными значениями зависимой переменной (по оси X)?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.