Вопросы с тегом «goodness-of-fit»

Тесты на соответствие подходят для определения того, разумно ли предполагать, что случайная выборка происходит из определенного распределения.

5
Могу ли я проверить гипотезу для искаженных нормальных данных?
У меня есть набор данных, который, как я думал, изначально был распространен. Затем я на самом деле посмотрел на это и понял, что это не так, в основном из-за того, что данные искажены, и я также провел тест Шапиро-Уилкса. Я все еще хотел бы проанализировать это, используя статистические методы, и …

2
Критерий Колмогорова – Смирнова: статистика p-значения и ks-критерия уменьшается с увеличением размера выборки
Почему p-значения и статистика ks-теста уменьшаются с увеличением размера выборки? Возьмите этот код Python в качестве примера: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Результаты: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) …

2
Тест на пригодность: вопрос о тесте Андерсона – Дарлинга и критерии Крамера – фон Мизеса
Я читаю веб-страницы для проверки пригодности, когда я пришел к тесту Андерсона – Дарлинга и критерию Крамера – фон Мизеса . До сих пор я понял суть; кажется, что критерий Андерсона – Дарлинга и критерий Крамера – фон Мизеса схожи, просто основаны на другой весовой функции . Также есть вариант …

3
Как визуализировать байесовскую доброту, пригодную для логистической регрессии
Для задачи байесовской логистической регрессии я создал апостериорное предиктивное распределение. Я выбираю из прогнозирующего распределения и получаю тысячи выборок (0,1) для каждого наблюдения, которое у меня есть. Визуализация пригодности менее интересна, например: На этом графике показаны 10 000 образцов + наблюдаемая исходная точка (слева можно разглядеть красную линию: да, это …

3
Как оценить добротность подгонки конкретной нелинейной модели? [закрыто]
Трудно сказать, что здесь спрашивают. Этот вопрос является двусмысленным, расплывчатым, неполным, чрезмерно широким или риторическим, и на него нельзя дать разумный ответ в его нынешней форме. Чтобы получить разъяснения по этому вопросу, чтобы его можно было снова открыть, посетите справочный центр . Закрыто 7 лет назад . У меня есть …

2
Есть ли у Андерсона дорогая проверка пригодности для двух наборов данных?
Я знаю, что ad.test () можно использовать для проверки нормальности. Можно ли получить ad.test для сравнения распределений из двух образцов данных? x <- rnorm(1000) y <- rgev(2000) ad.test(x,y) Как я могу выполнить тест Андерсона-Дарлинга на 2 образцах?

1
Как нарисовать подобранный график и реальный график распределения гаммы на одном графике?
Загрузите пакет, необходимый. library(ggplot2) library(MASS) Генерация 10000 номеров, приспособленных к гамма-распределению. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Нарисуйте функцию плотности вероятности, предположим, что мы не знаем, к какому распределению x подходит. t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) t1$y <- t1$y/sum(t1[,2]) ggplot() + geom_point(data …

4
Модель истории дискретного времени (выживания) в R
Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки: ID, …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

4
Как я могу вычислить статистику теста Пирсона на отсутствие соответствия модели логистической регрессии в R?
Коэффициент отношения правдоподобия (он же отклонение) и критерий несоответствия (или качества соответствия) довольно просто получить для модели логистической регрессии (подгонка с использованием функции) в R. Однако это может быть легко подсчитать количество клеток в конечном итоге достаточно низко, чтобы тест был ненадежным. Один из способов проверить надежность теста отношения правдоподобия …

2
Как оценить качество пригодности для жизненных функций
Я новичок в анализе выживания, хотя у меня есть некоторые знания в области классификации и регрессии. Для регрессии мы имеем статистику MSE и R square. Но как мы можем сказать, что модель выживания A превосходит модель выживания B помимо каких-то графических графиков (кривая КМ)? Если возможно, объясните разницу с примером …

3
статистический тест, чтобы увидеть, является ли связь линейной или нелинейной
У меня есть пример данных, установленных следующим образом: Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) …

2
Совершенство в соответствии с распределением Пуассона
Каковы некоторые из хорошо известных статистических тестов для измерения достоверности соответствия наблюдаемых случайных величин распределению Пуассона? Я знаю, что тест Колмогорова-Смирнова один из таких, есть ли другие?

2
Рассчитать кривую ROC для данных
Итак, у меня есть 16 испытаний, в которых я пытаюсь идентифицировать человека по биометрической характеристике, используя расстояние Хэмминга. Мой порог установлен на 3,5. Мои данные ниже, и только пробная версия 1 является истинным положительным результатом: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.