Вопросы с тегом «chi-squared»

Тест (обычно распределение, независимость или соответствие) или семейство распределений, связанных с таким тестом.

1
Как я могу адаптировать ANOVA для двоичных данных?
У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который представляет собой процент правильных прогнозов для каждой из моделей. Мне кажется, что я …

1
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?
mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и ti(x1) + ti(x2) + ti(x1, x2)может дать (немного) разные результаты. MWE …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
Какое распределение предполагает точный тест Фишера?
В своей работе я видел несколько применений точного теста Фишера, и мне было интересно, насколько хорошо он соответствует моим данным. Просматривая несколько источников, я понял, как рассчитать статистику, но так и не увидел четкого и формального объяснения предполагаемой нулевой гипотезы. Может кто-нибудь объяснить или направить меня к формальному объяснению предполагаемого …

1
Какой тест для анализа перекрестных таблиц: Boschloo или Barnard?
Я анализирую таблицу 2х2 из небольшого набора данных из 30 пациентов. Мы ретроспективно пытаемся найти некоторые переменные, которые дают подсказку о том, какое лечение выбрать. Переменные (общепринятые / странные) и решение о лечении (A / B) представляют особый интерес, и поэтому данные выглядят так: Obs/Tr. Dec.normalstrangeA12012B1351825530Obs/Tr. Dec.ABnormal121325strange055121830\begin{array} {|r|r|r|r|} \hline \text{Obs/Tr. …

2
Ожидание
Пусть , , , и независимы. Чего ожидать от ?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} Легко найти по симметрии. Но я не знаю, как найти ожидание . Не могли бы вы дать несколько советов?E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} Что я получил до …

1
Два образца хи-квадрат
Этот вопрос взят из книги Ван дер Ваарта «Асимптотическая статистика», стр. 253. № 3: Предположим, что и являются независимыми полиномиальными векторами с параметрами и . При нулевой гипотезе, что показывают, чтоXmXm\mathbf{X}_mYnYn\mathbf{Y}_n(m,a1,…,ak)(m,a1,…,ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(n,b1,…,bk)(n,b_1,\ldots,b_k)ai=biai=bia_i=b_i χ 2 к - 1 с я=(Хм,я+Уп,я)/(т+п)∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i} имеет . где .χ2k−1χk−12\chi^2_{k-1}c^i=(Xm,i+Yn,i)/(m+n)c^i=(Xm,i+Yn,i)/(m+n)\hat{c}_i …

1
Логистическая регрессия против хи-квадрата в таблицах сопряженности 2x2 и Ix2 (однофакторный - двоичный ответ)?
Я пытаюсь понять использование логистической регрессии в таблицах сопряженности 2x2 и Ix2. Например, используя это в качестве примера В чем разница между использованием критерия хи-квадрат и логистической регрессией? Как насчет таблицы с несколькими номинальными коэффициентами (таблица Ix2), например: Существует аналогичный вопрос здесь - но ответ в основном , что хи-квадрат …

3
G-тест против критерия хи-квадрат Пирсона
Я проверяю независимость в таблице непредвиденных обстоятельствЯ не знаю, лучше ли G-тест или критерий хи-квадрат Пирсона. Размер выборки исчисляется сотнями, но есть небольшое количество клеток. Как указано на странице Википедии , приближение к распределению хи-квадрат лучше для G-теста, чем для теста Пирсона. Но я использую симуляцию Монте-Карло для вычисления значения …

2
Как статистика Чи-квадрат Пирсона приближается к распределению Чи-квадрат
Таким образом, если статистика Пиарсона Chi Squared дана для таблицы , то ее форма:1×N1×N1 \times N ∑i=1n(Oi−Ei)2Ei∑i=1n(Oi−Ei)2Ei\sum_{i=1}^n\frac{(O_i - E_i)^2}{E_i} Тогда это приближается к , распределению хи-квадрат с степенями свободы, поскольку размер выборки становится больше. н - 1 нχ2n−1χn−12\chi_{n-1}^2n−1n−1n-1NNN Я не понимаю, как работает это асимптотическое приближение. Я чувствую, что в …

1
Почему Anova () и drop1 () предоставили разные ответы для GLMM?
У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние два дают одинаковые ответы. Используя кучу сфабрикованных данных, я обнаружил, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
Доверительный интервал для хи-квадрат
Я пытаюсь найти решение для сравнения двух тестов "хи-квадрат". Точнее, я хочу сравнить результаты двух независимых экспериментов. В этих экспериментах авторы использовали хи-квадрат добротности, чтобы сравнить случайное предположение (ожидаемые частоты) с наблюдаемыми частотами. Два эксперимента получили одинаковое количество участников, и экспериментальные процедуры идентичны, только стимулы изменены. Результаты двух экспериментов показали …

2
Тест хи-квадрат на равенство распределений: сколько нулей он терпит?
Я сравниваю две группы мутантов, каждая из которых может иметь только один из 21 различных фенотипов. Я хотел бы посмотреть, одинаково ли распределение этих результатов между двумя группами. Я нашел онлайн-тест, который вычисляет «критерий хи-квадрат для равенства распределений» и дает мне некоторые правдоподобные результаты. Тем не менее, в этой таблице …

4
Как статистически доказать, имеет ли столбец категориальные данные или не использует Python
У меня есть фрейм данных в Python, где мне нужно найти все категориальные переменные. Проверка типа столбца не всегда работает, потому что intтип также может быть категоричным. Поэтому я ищу помощь в поиске правильного метода проверки гипотез, чтобы определить, является ли столбец категоричным или нет. Я пробовал ниже критерия хи-квадрат, …

2
Тест независимости против теста гомогенности
Я преподаю базовый курс статистики, и сегодня я рассмотрю критерий независимости по критерию хи-квадрат для двух категорий и критерий однородности. Эти два сценария концептуально различны, но могут использовать одну и ту же статистику теста и распределение. В тесте на однородность предполагается, что предельные итоги для одной из категорий являются частью …

4
Как я могу вычислить статистику теста Пирсона на отсутствие соответствия модели логистической регрессии в R?
Коэффициент отношения правдоподобия (он же отклонение) и критерий несоответствия (или качества соответствия) довольно просто получить для модели логистической регрессии (подгонка с использованием функции) в R. Однако это может быть легко подсчитать количество клеток в конечном итоге достаточно низко, чтобы тест был ненадежным. Один из способов проверить надежность теста отношения правдоподобия …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.