Вопросы с тегом «chi-squared»

Тест (обычно распределение, независимость или соответствие) или семейство распределений, связанных с таким тестом.

1
Понимание критерия хи-квадрат и распределения хи-квадрат
Я пытаюсь понять логику теста хи-квадрат. Критерий хи-квадрат равен . Затем сравнивается с распределением хи-квадрат, чтобы определить значение p., чтобы отклонить или не принять нулевую гипотезу. : наблюдения получены из распределения, которое мы использовали для создания наших ожидаемых значений. Например, мы могли бы проверить, дается ли вероятность получения как мы …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Почему в тесте независимости используется распределение хи-квадрат?
В тесте на соответствие критерия используется следующая статистика : В тесте предоставление этого условия выполнены, как используются - распределение для вычисления р-значение, учитывая правда можно было бы наблюдать такое значение в репрезентативной выборке одного и того же размера.χ2χ2\chi^2χ20=∑i=1n(Oi−Ei)2Eiχ02=∑i=1n(Oi−Ei)2Ei \chi_0^2=\sum_{i=1}^n\frac{(O_i-E_i)^2}{E_i} χ2χ2\chi^2H0H0H_0 Однако для того, чтобы статистика следовала за -распределением (с степенями …

2
-test В.С. -test для сравнения шансов подхватить простуду в 2 -х группах
Я только что прочитал в довольно уважаемом (популярном) научном журнале (немецкий PM, 02/2013, с.36) об интересном эксперименте (к сожалению, без источника). Это привлекло мое внимание, потому что интуитивно я сомневался в значимости результата, но предоставленной информации было достаточно для воспроизведения статистического тестирования. Исследователи задавались вопросом, увеличивает ли вероятность простуды в …

2
Регулировка значения p для адаптивного последовательного анализа (для теста хи-квадрат)?
Я хотел бы знать, какая статистическая литература имеет отношение к следующей проблеме, и, возможно, даже идея о том, как ее решить. Представьте себе следующую проблему: У нас есть 4 возможных лечения некоторых заболеваний. Чтобы проверить, какое лечение лучше, мы проводим специальное исследование. В испытании мы начинаем с отсутствия субъектов, затем, …

1
Точный критерий Фишера и гипергеометрическое распределение
Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст …

1
Что вы будете делать, если ваши степени свободы пройдут конец ваших столов?
Степени свободы в моей F-таблице недостаточно высоки для моей большой выборки. Например, если у меня есть F с 5 и 6744 степенями свободы, как мне найти 5% критическое значение для ANOVA? Что если бы я делал тест хи-квадрат с большими степенями свободы? [Подобный вопрос был опубликован некоторое время назад, но …

1
Для какого типа выбора можно использовать критерий хи-квадрат?
Здесь я спрашиваю о том, что обычно делают другие, чтобы использовать критерий хи-квадрат для выбора функции по результатам в контролируемом обучении. Если я правильно понимаю, проверяют ли они независимость между каждой функцией и результатом и сравнивают значения p между тестами для каждой функции? В http://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test , Критерий хи-квадрат Пирсона - …

1
Как интерпретировать остаточные цвета на мозаичном графике?
Это мозаичный график набора данных таблицы сопряженности, HairEyeColorописанный здесь . Как мне интерпретировать цвета, представляющие остатки? В чем разница между высокими и положительными остатками Пирсона (показаны синим цветом) по сравнению с низкими и отрицательными, показанными красным цветом?

1
Протестируйте модель GLM, используя нулевые и модельные отклонения
Я построил модель glm в R и протестировал ее с помощью группы тестирования и обучения, поэтому уверен, что она работает хорошо. Результаты от R: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.781e+00 1.677e-02 -165.789 < 2e-16 *** Coeff_A 1.663e-05 5.438e-06 3.059 0.00222 ** log(Coeff_B) 8.925e-01 1.023e-02 87.245 < 2e-16 …

2
Тонкость р-значения: больше-равно против больше
Когда я читаю книгу Вассермана «Вся статистика», я замечаю тонкую тонкость в определении p-значений, которую я не могу понять. Неформально Вассерманн определяет значение p как [..] вероятность (ниже H0H0H_0 ) наблюдения значения тестовой статистики такая же или более экстремальная, чем на самом деле наблюдалось. Акцент добавлен. То же самое более …

1
Распределение отношения зависимых хи-квадрат случайных величин
Предположим, что где независимы.X=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) Мой вопрос, что делает распределение Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} следовать? Отсюда я знаю, что отношение двух хи-квадрат случайных величин, выраженных как соответствует распределению бета-версий. Я думаю , что это предполагает независимость …

2
Упорядочить статистику (например, минимум) бесконечного набора переменных хи-квадрат?
Это мой первый раз здесь, поэтому, пожалуйста, дайте мне знать, если я смогу уточнить свой вопрос каким-либо образом (включая форматирование, теги и т. Д.). (И, надеюсь, я смогу редактировать позже!) Я пытался найти ссылки и пытался решить сам, используя индукцию, но потерпел неудачу в обоих случаях. Я пытаюсь упростить распределение, …

2
Почему в тесте Макнемара используется хи-квадрат, а не нормальное распределение?
Я только что заметил, как в неточном тесте Макнемара используется асимптотическое распределение хи-квадрат. Но поскольку точный тест (для таблицы двух случаев) основан на биномиальном распределении, почему не принято предлагать нормальное приближение к биномиальному распределению? Спасибо.

4
Несколько тестов хи-квадрат
У меня есть перекрестные данные в таблице 2 x 2 x 6. Давайте назовем размеры response, Aи B. Я подгоняю логистическую регрессию к данным с помощью модели response ~ A * B. Анализ отклонения этой модели говорит о том, что оба термина и их взаимодействие являются значительными. Однако, глядя на …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.