Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

1
Почему lm и biglm в R дают разные значения p для одних и тех же данных?
Вот небольшой пример: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) Теперь с base::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738 3.491 0.0732 . x -1.3800 0.3191 …

2
В чем разница между «регулярной» линейной регрессией и глубокой обучаемостью?
Я хочу знать разницу между линейной регрессией в обычном анализе машинного обучения и линейной регрессией в условиях «глубокого обучения». Какие алгоритмы используются для линейной регрессии в условиях глубокого обучения.

2
Использовать коэффициент корреляции Пирсона в качестве цели оптимизации в машинном обучении
В машинном обучении (для проблем регрессии) я часто вижу среднеквадратическую ошибку (MSE) или среднюю абсолютную ошибку (MAE), используемую в качестве функции ошибки для минимизации (плюс термин регуляризации). Мне интересно, есть ли ситуации, когда использование коэффициента корреляции было бы более уместным? если такая ситуация существует, то: В каких ситуациях коэффициент корреляции …

1
Почему анализ временных рядов не считается алгоритмом машинного обучения
Почему анализ временных рядов не считается алгоритмом машинного обучения (в отличие от линейной регрессии). И регрессия, и анализ временных рядов являются методами прогнозирования. Так почему один из них считается алгоритмом обучения, а не другой?

1
Должен ли частичный составлять в сумме в множественной регрессии?
Ниже приводится модель, созданная из mtcarsнабора данных: > ols(mpg~wt+am+qsec, mtcars) Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 0.850 sigma 2.4588 d.f. 3 R2 adj 0.834 d.f. 28 Pr(> chi2) 0.0000 …

1
Почему бы не использовать надежную регрессию каждый раз?
Примеры этой страницы показывают, что выбросы заметно влияют на простую регрессию, и это можно преодолеть с помощью методов надежной регрессии: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Я считаю, что lmrob и ltsReg - это другие надежные методы регрессии. Почему бы не делать надежную регрессию (например, rlm или rq) каждый раз, а не выполнять простую …

2
VC измерение регрессионных моделей
В серии лекций « Изучение данных» профессор упоминает, что измерение VC измеряет сложность модели по тому, на сколько точек данная модель может разбиться. Так что это прекрасно работает для моделей классификации, где мы можем сказать из N точек, если классификатор способен эффективно разбить k точек, мерой измерения VC будет K. …

1
Какая связь между регуляризацией и методом множителей Лагранжа?
Чтобы не допустить перегрузки людей, люди добавляют термин регуляризации (пропорциональный квадрату суммы параметров модели) с параметром регуляризации к функции стоимости линейной регрессии. Является ли этот параметр таким же, как множитель Лагранжа? Так регуляризация такая же, как метод множителя Лагранжа? Или как эти методы связаны? λλλ\lambdaλλ\lambda


2
Можно ли строить линию регрессии для ранжированных данных (корреляция Спирмена)?
У меня есть данные, для которых я рассчитал корреляцию Спирмена и хочу визуализировать их для публикации. Зависимая переменная ранжируется, независимая переменная - нет. То, что я хочу визуализировать, является скорее общей тенденцией, чем фактическим наклоном, поэтому я оценил независимую и применил корреляцию / регрессию Спирмена. Но как только я подготовил …

2
Почему R требует много времени для подбора модели с многоуровневым фактором?
Я подхожу к модели с многовариантным множителем, и R требует очень много времени, чтобы соответствовать этой модели. Почему это? Например, если я подгоняю регрессию к прогнозированию зарплат игроков и включаю предиктор факторов для всех национальностей игроков, это займет больше времени, чем подгонка модели для зарплат игроков с непрерывным предиктором, таким …

1
Сравнение коэффициентов регрессии одной и той же модели в разных наборах данных
Я оцениваю два (2) хладагента (газа), которые использовались в одной и той же системе охлаждения. У меня есть данные о температуре всасывания ( ), температуре конденсации ( ) и силе тока ( ) для оценки. Есть два (2) набора данных; 1-й хладагент ( ) и 2-й хладагент ( ). Я …

1
Точный критерий Фишера и гипергеометрическое распределение
Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст …

3
Рассчитать неопределенность наклона линейной регрессии на основе неопределенности данных
Как рассчитать неопределенность наклона линейной регрессии на основе неопределенности данных (возможно, в Excel / Mathematica)? Пример: у нас есть точки данных (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16), но каждое значение y имеет неопределенность 4. Большинство функций, которые я обнаружил, вычислили бы неопределенность как 0, так как точки полностью …

2
Гетероскедастичность и нормальность остатков
Полагаю, у меня неплохая линейная регрессия (это для университетского проекта, поэтому мне не нужно быть очень точным). Дело в том, что если я построю график зависимости остатков от прогнозируемых значений, то (по словам моего учителя) есть намек на гетероскедастичность. Но если я нанесу QQ-график остатков, ясно, что они нормально распределены. …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.