Вопросы с тегом «variance»

Ожидаемое квадратичное отклонение случайной величины от ее среднего значения; или среднеквадратичное отклонение данных об их среднем значении.

2
В моделях Normal и Binomial всегда задняя дисперсия меньше предыдущей дисперсии?
Или какие условия это гарантируют? В целом (и не только для нормальных и биномиальных моделей) я полагаю, что главная причина, которая нарушила это утверждение, состоит в том, что существует несоответствие между моделью выборки и предыдущей, но что еще? Я начинаю с этой темы, поэтому я очень ценю простые примеры

3
Центральная предельная теорема и распределение Парето
Может ли кто-нибудь предоставить простое (непрофессиональное) объяснение связи между распределениями Парето и теоремой о центральном пределе (например, применимо ли это? Почему / почему нет?)? Я пытаюсь понять следующее утверждение: «Центральная предельная теорема не работает с каждым распределением. Это связано с одним подлым фактом - выборочные средства группируются вокруг среднего значения …

1
Использование медианы для расчета дисперсии
У меня есть 1-D случайная величина, которая чрезвычайно искажена. Чтобы нормализовать это распределение, я хочу использовать медиану, а не среднее. у меня такой вопрос: могу ли я вычислить дисперсию распределения, используя медиану в формуле вместо среднего? т.е. я могу заменить Var(X)=∑[(Xi−mean(X))2]/nVar(X)=∑[(Xi−mean(X))2]/n \mathrm{Var}(X) = \sum[(X_i - \mathrm{mean}(X))^2]/n с Var(X)=∑[(Xi−median(X))2]/nVar(X)=∑[(Xi−median(X))2]/n \mathrm{Var}(X) = …
10 variance  mean  median 

4
Модель истории дискретного времени (выживания) в R
Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки: ID, …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
Что такое точечная дисперсия?
Читая «Элементы статистического обучения» , я несколько раз встречал термин «точечная дисперсия». Хотя у меня есть смутное представление о том, что это, вероятно, означает, я был бы рад узнать, Как это определяется? Как это происходит?
10 variance 

4
Дисперсия резисторов параллельно
Предположим, у вас есть набор резисторов R, все из которых имеют среднее значение μ и дисперсию σ. Рассмотрим часть схемы со следующим расположением: (r) || (r + r) || (г + г + г). Эквивалентное сопротивление каждой части составляет r, 2r и 3r. Тогда дисперсия каждого сечения будет σ2σ2σ^2 , …

1
R линейная регрессия категориальной переменной «скрытое» значение
Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод, заданный R, будет выглядеть примерно …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Для какой проблемы или игры оптимальным решением являются дисперсия и стандартное отклонение?
Для заданной случайной величины (или совокупности, или стохастического процесса) математическое ожидание является ответом на вопрос: какой точечный прогноз минимизирует ожидаемую квадратичную потерю? , Кроме того, это оптимальное решение для игры. Угадайте следующую реализацию случайной величины (или новую ничью из популяции), и я накажу вас по квадрату расстояния между значением и …

2
Разброс отклонения: термин для ожидаемой квадратической ошибки прогноза за вычетом неснижаемой ошибки
Hastie et al. «Элементы статистического обучения» (2009) рассматривают процесс генерирования данных с E ( ε ) = 0 и Var ( ε ) = σ 2 ε .Y= ф( Х) + εY=f(X)+ε Y = f(X) + \varepsilon E(ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var(ε)=σ2εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Они представляют следующее разностное разложение ожидаемой квадратной ошибки прогноза в точке (стр. …

3
Вращайте компоненты PCA, чтобы выровнять дисперсию в каждом компоненте
Я пытаюсь уменьшить размерность и шум набора данных, выполняя PCA для набора данных и выбрасывая последние несколько ПК. После этого я хочу использовать некоторые алгоритмы машинного обучения на оставшихся ПК, и поэтому я хочу нормализовать данные путем выравнивания дисперсии ПК, чтобы алгоритмы работали лучше. Один простой способ - просто нормализовать …


2
Дисперсия среднего значения выборки начальной загрузки
Пусть быть отчетливым наблюдением (без связей). Пусть X * 1 , . , , , Х * п обозначает образец самозагрузки (образец из эмпирической CDF) и пусть ˉ Х * п = 1Икс1, . , , , XNX1,...,XnX_{1},...,X_{n}Икс*1, . , , , X*NX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*} . НайтиE( ˉ X ∗ n )иVar( …

2
Нахождение дисперсии оценки для максимального правдоподобия для распределения Пуассона
Если - это распределения Пуассона с параметром я определил, что максимальная оценка вероятности равна для данных . Поэтому мы можем определить соответствующий оценщик Мой вопрос: как бы вы определили дисперсию этой оценки? & beta ; & beta ; ( к 1 , ... , K п ) = 1К1, …

2
Нулевая гипотеза Манна-Уитни при неравной дисперсии
Мне просто интересно узнать о нулевой гипотезе U-критерия Манна-Уитни. Я часто вижу, что утверждалось, что нулевая гипотеза состоит в том, что две популяции имеют равные распределения. Но я думаю - если бы у меня было две нормальные популяции с одинаковым средним, но крайне неравным отклонением, тест Манна-Уитни, вероятно, не обнаружил …

4
Коробка Кокса Преобразования для регрессии
Я пытаюсь согласовать линейную модель с некоторыми данными только одним предиктором (скажем, (x, y)). Данные таковы, что для малых значений x значения y обеспечивают плотное прилегание к прямой линии, однако при увеличении значений x значения y становятся более изменчивыми. Вот пример таких данных (R код) y = c(3.2,3.4,3.5,3.8,4.2,5.5,4.5,6.8,7.4,5.9) x = …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.