Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?
Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо на уровне 1% (t-оценка -4,52). Сообщество - это …

2
Какова мощность регрессионного теста F?
Классический F-тест для подмножеств переменных в полилинейной регрессии имеет вид где - сумма квадратов ошибок в «уменьшенной» модели, которая вложена в «большую» модель , а - степени свободы две модели. При нулевой гипотезе, что дополнительные переменные в «большой» модели не имеют линейной объяснительной силы, статистика распределяется как F с степенями …

3
Существуют ли какие-либо библиотеки для CART-подобных методов, использующих разреженные предикторы и ответы?
Я работаю с некоторыми большими наборами данных, используя пакет gbm в R. И моя матрица предикторов, и мой вектор ответов довольно редки (то есть большинство записей равно нулю). Я надеялся построить деревья решений, используя алгоритм, который использует преимущества этой редкости, как это было сделано здесь ). В этой статье, как …


1
Среднеквадратичное значение против среднего абсолютного отклонения?
И Root Mean Square и Среднее абсолютное отклонение , кажется , как меры по величине изменчивости (особенно , когда переменные являются анолитом и -ve). Каковы правила большого пальца, чтобы выбрать один из них над другим?

2
Использование пуассоновской регрессии для непрерывных данных?
Можно ли использовать распределение Пуассона для анализа как непрерывных, так и дискретных данных? У меня есть несколько наборов данных, в которых переменные ответа являются непрерывными, но напоминают распределение Пуассона, а не нормальное распределение. Однако распределение Пуассона является дискретным распределением и обычно связано с числами или счетами.

2
Как можно построить непрерывный непрерывный взаимодействия в ggplot2?
Допустим, у меня есть данные: x1 <- rnorm(100,2,10) x2 <- rnorm(100,2,10) y <- x1+x2+x1*x2+rnorm(100,1,2) dat <- data.frame(y=y,x1=x1,x2=x2) res <- lm(y~x1*x2,data=dat) summary(res) Я хочу построить непрерывное непрерывное взаимодействие так, чтобы x1 находился на оси X, а x2 был представлен 3 строками, одна из которых представляет x2 при Z-значении 0, одна при …

5
Измерение регрессии до среднего значения при попадании в дома
Любой, кто следит за бейсболом, скорее всего, слышал о непонятном выступлении в стиле MVP в Торонто Жозе Баутиста. За четыре года до этого он совершил около 15 хоумранов за сезон. В прошлом году он ударил 54, число превзошло только 12 игроков в истории бейсбола. В 2010 году ему заплатили 2,4 …
11 r  regression  modeling 

4
Как представить выигрыш в объясненной дисперсии благодаря соотношению Y и X?
Я ищу, как (визуально) объяснить простую линейную корреляцию для студентов первого курса. Классический способ визуализации - построить график рассеяния Y ~ X с прямой линией регрессии. Недавно мне пришла в голову идея расширить этот тип графики, добавив к графику еще 3 изображения, оставив мне: график рассеяния y ~ 1, затем …

3
Сравнение регрессионных моделей по данным подсчета
Недавно я подобрал 4 модели множественной регрессии для одного и того же предиктора / данных ответа. Две модели мне подходят с пуассоновской регрессией. model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...) model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...) Две модели мне подходят с …

4
Подгонка по лассо по координатному спуску: реализации с открытым исходным кодом? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Какие реализации с открытым исходным кодом - на любом языке - существуют там, которые могут вычислять лассо-пути регуляризации для …

4
Пророк из Facebook отличается от линейной регрессии?
Итак, что я прочитал о пророке Facebook, так это то, что он в основном разбивает временные ряды на тренды и сезонность. Например, аддитивная модель будет записана как: Y( т ) = г( t ) + s ( t ) + h ( t ) + eTY(T)знак равног(T)+s(T)+час(T)+еT y(t) = g(t) …

5
Когда использовать модель со смешанным эффектом?
Модели линейных смешанных эффектов - это расширения моделей линейной регрессии для данных, которые собираются и обобщаются в группы. Ключевым преимуществом является то, что коэффициенты могут варьироваться по отношению к одной или нескольким групповым переменным. Тем не менее, я борюсь с тем, когда использовать модель со смешанным эффектом? Я разработаю свои …


1
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?
mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и ti(x1) + ti(x2) + ti(x1, x2)может дать (немного) разные результаты. MWE …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.