Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

3
Загадка регрессии к среднему
В главе «Возвращение к среднему значению» Даниеля Канемана «Мышление, быстрое и медленное» приводится пример, и читателю предлагается спрогнозировать продажи отдельных магазинов с учетом общего прогноза продаж и показателей продаж за предыдущий год. , Например (пример книги имеет 4 магазина, я использую 2 здесь для простоты): Store 2011 2012 1 100 …

1
Огромные коэффициенты в логистической регрессии - что это значит и что делать?
Я получаю огромные коэффициенты во время логистической регрессии, смотрите коэффициенты с krajULKV: > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance Residuals: Min 1Q Median 3Q Max -2.7796 -1.0958 -0.3101 …

2
Определить оптимальную скорость обучения для градиентного спуска в линейной регрессии
Как определить оптимальную скорость обучения для градиентного спуска? Я думаю, что я мог бы автоматически настроить его, если функция стоимости возвращает большее значение, чем в предыдущей итерации (алгоритм не будет сходиться), но я не совсем уверен, какое новое значение он должен принимать.

2
SVM регрессия с продольными данными
У меня около 500 переменных на пациента, каждая переменная имеет одно непрерывное значение и измеряется в трех разных временных точках (через 2 месяца и через 1 год). С регрессией я хотел бы предсказать исход лечения для новых пациентов. Можно ли использовать SVM-регрессию с такими продольными данными?

2
Обучение на реляционных данных
Настройки Многие алгоритмы работают с одним отношением или таблицей, в то время как многие реальные базы данных хранят информацию в нескольких таблицах (Domingos, 2003). Вопрос: Какие типы алгоритмов хорошо усваиваются из нескольких (реляционных) таблиц. В частности, меня интересуют алгоритмы, применимые к задачам регрессии и классификации (не ориентированные на сетевой анализ, …

4
Расширение логистической регрессии для результатов в диапазоне от 0 до 1
У меня есть проблема регрессии, когда результаты не строго 0, 1, а скорее в диапазоне всех действительных чисел от 0 до 1, включая .Y= [ 0 , 0.12 , 0.31 , . , , , 1 ]Yзнак равно[0,0,12,0,31,,,,,1]Y = [ 0, 0.12, 0.31, ..., 1 ] Эта проблема уже обсуждалась …

3
Перемещение знака при добавлении еще одной переменной в регрессию и с гораздо большей величиной
Базовая настройка: регрессионная модель: где C - вектор управляющих переменных.y=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵy=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵy = \text{constant} +\beta_1x_1+\beta_2x_2+\beta_3x_3+\beta_4x_4+\alpha C+\epsilon Я заинтересован в и ожидаю, что \ beta_1 и \ beta_2 будут отрицательными. Однако в модели существует проблема мультиколлинеарности, коэффициент корреляции определяется как: corr ( x_1 , x_2) = 0,9345, corr ( x_1 , x_3) = …

4
Коробка Кокса Преобразования для регрессии
Я пытаюсь согласовать линейную модель с некоторыми данными только одним предиктором (скажем, (x, y)). Данные таковы, что для малых значений x значения y обеспечивают плотное прилегание к прямой линии, однако при увеличении значений x значения y становятся более изменчивыми. Вот пример таких данных (R код) y = c(3.2,3.4,3.5,3.8,4.2,5.5,4.5,6.8,7.4,5.9) x = …

2
Определение крупнейшего участника в группе
Я не знаю много о статистике, так что терпите меня. Допустим, у меня есть набор из 1000 рабочих. Я хочу выяснить, кто самый трудный работник, но я могу измерить только объем работы, выполняемой группами по 1-100 человек за час работы. Предполагая, что каждый работник всегда выполняет примерно одинаковый объем работы, …

1
Доверительные и прогнозные интервалы линейной регрессионной модели
Итак, я пытаюсь понять линейную регрессию. У меня есть набор данных, и все выглядит хорошо, но я в замешательстве. Это моя линейная модель-сводка: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.2068621 0.0247002 8.375 4.13e-09 *** temp 0.0031074 0.0004779 6.502 4.79e-07 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 …
9 r  regression 

4
Когда использовать непараметрическую регрессию?
Я использую PROC GLM в SAS, чтобы соответствовать уравнению регрессии следующего вида Y=b0+b1X1+b2X2+b3X3+b4tY=b0+b1X1+b2X2+b3X3+b4t Y = b_0 + b_1X_1 + b_2X_2 + b_3X_3 + b_4t График QQ результирующих остатков указывает на отклонение от нормы. Любое преобразование бесполезно для нормализации остатков.YYY На этом этапе я могу безопасно переключиться на непараметрические методы, такие …

1
Как сравнить наблюдаемые и ожидаемые события?
Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

3
Коррекция Бонферрони с корреляцией Пирсона и линейной регрессией
Я выставляю статистику по 5 IV (5 черт личности, экстраверсия, приятность, добросовестность, невротизм, открытость) против 3 DVs Отношение к PCT, Отношение к CBT, Отношение к PCT против CBT. Я также добавил возраст и пол, чтобы увидеть, какие еще есть эффекты. Я тестирую, чтобы понять, могут ли черты личности предсказать отношение …

2
Некоторые из моих предикторов имеют очень разные масштабы - нужно ли их трансформировать перед подбором модели линейной регрессии?
Я хотел бы запустить линейную регрессию по многомерному набору данных. Существуют различия между различными измерениями с точки зрения их величины порядка. Например, измерение 1 обычно имеет диапазон значений [0, 1], а измерение 2 имеет диапазон значений [0, 1000]. Нужно ли выполнять какие-либо преобразования, чтобы гарантировать, что диапазоны данных для разных …

1
Моделирование пространственного тренда путем регрессии с координатами качестве предикторов
Я планирую включить координаты в качестве ковариат в уравнение регрессии, чтобы скорректировать пространственный тренд, который существует в данных. После этого я хочу протестировать остатки на пространственной автокорреляции в случайной вариации. У меня есть несколько вопросов: Должен ли я выполнять линейную регрессию, в которой только независимые переменные являются координатами и а …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.