Вопросы с тегом «normality-assumption»

Многие статистические методы предполагают, что данные обычно распределяются. Используйте этот тег для вопросов о допущении и проверке нормальности или о нормальности как * свойство *. Используйте [normal-distribution] для вопросов о нормальном распределении как таковом.

1
Распространены ли какие-либо процессы в природе совершенно нормально?
Много было сказано о важности нормальных распределений в природе. Многие измерения, такие как рост или вес, распределены примерно нормально. Но ни один из них не является абсолютно нормальным, насколько я понимаю. Учитывая, что нормальное распределение является одним из максимальных распределений энтропии , представляется вероятным, что природе должно «нравиться». Но, подумав, …

1
Вопрос о предположении нормальности t-критерия
Для t-тестов, согласно большинству текстов, есть предположение, что данные о населении обычно распределяются. Я не понимаю, почему это так. Разве t-критерий не требует только того, чтобы распределение выборки средних значений выборки было нормально распределено, а не совокупность? Если это так, что критерий Стьюдента в конечном итоге требует только нормальности в …

2
Почему корреляция рангов Пирсона действительна, несмотря на предположение о нормальности?
В настоящее время я читаю предположения о корреляциях Пирсона. Важным предположением для последующего t-критерия является то, что обе переменные происходят из нормальных распределений; если они этого не делают, то рекомендуется использовать альтернативные меры, такие как Spearman rho. Корреляция Спирмена вычисляется как корреляция Пирсона, используя только ранги X и Y вместо …

3
Оценка силы теста нормальности (в R)
Я хочу оценить точность тестов нормальности для разных размеров выборки в R (я понимаю, что тесты нормальности могут вводить в заблуждение ). Например, чтобы посмотреть на тест Шапиро-Уилка, я провожу следующую симуляцию (а также нанесение на график результатов) и ожидаю, что с увеличением размера выборки вероятность отклонения нуля уменьшается: n …

2
Рассчитать кривую ROC для данных
Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

7
Нормальное распределение и монотонные преобразования
Я слышал, что многие количества, которые встречаются в природе, обычно распределяются. Обычно это оправдано с использованием центральной предельной теоремы, которая гласит, что при усреднении большого числа случайных величин iid вы получаете нормальное распределение. Так, например, признак, который определяется аддитивным эффектом большого числа генов, может быть приблизительно нормально распределен, поскольку значения …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.