Статистика и большие данные chi-squared

1

Как я могу адаптировать ANOVA для двоичных данных?

У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который представляет собой процент правильных прогнозов для каждой из моделей. Мне кажется, что я …

11 anova chi-squared generalized-linear-model

1

R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и ti(x1) + ti(x2) + ti(x1, x2)может дать (немного) разные результаты. MWE …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

2

Какое распределение предполагает точный тест Фишера?

В своей работе я видел несколько применений точного теста Фишера, и мне было интересно, насколько хорошо он соответствует моим данным. Просматривая несколько источников, я понял, как рассчитать статистику, но так и не увидел четкого и формального объяснения предполагаемой нулевой гипотезы. Может кто-нибудь объяснить или направить меня к формальному объяснению предполагаемого …

11 hypothesis-testing chi-squared multinomial contingency-tables fishers-exact

1

Какой тест для анализа перекрестных таблиц: Boschloo или Barnard?

Я анализирую таблицу 2х2 из небольшого набора данных из 30 пациентов. Мы ретроспективно пытаемся найти некоторые переменные, которые дают подсказку о том, какое лечение выбрать. Переменные (общепринятые / странные) и решение о лечении (A / B) представляют особый интерес, и поэтому данные выглядят так: Obs/Tr. Dec.normalstrangeA12012B1351825530Obs/Tr. Dec.ABnormal121325strange055121830\begin{array} {|r|r|r|r|} \hline \text{Obs/Tr. …

11 chi-squared power contingency-tables fishers-exact

2

Ожидание

Пусть , , , и независимы. Чего ожидать от ?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} Легко найти по симметрии. Но я не знаю, как найти ожидание . Не могли бы вы дать несколько советов?E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} Что я получил до …

10 probability self-study normal-distribution chi-squared expected-value

1

Два образца хи-квадрат

Этот вопрос взят из книги Ван дер Ваарта «Асимптотическая статистика», стр. 253. № 3: Предположим, что и являются независимыми полиномиальными векторами с параметрами и . При нулевой гипотезе, что показывают, чтоXmXm\mathbf{X}_mYnYn\mathbf{Y}_n(m,a1,…,ak)(m,a1,…,ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(n,b1,…,bk)(n,b_1,\ldots,b_k)ai=biai=bia_i=b_i χ 2 к - 1 с я=(Хм,я+Уп,я)/(т+п)∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i} имеет . где .χ2k−1χk−12\chi^2_{k-1}c^i=(Xm,i+Yn,i)/(m+n)c^i=(Xm,i+Yn,i)/(m+n)\hat{c}_i …

10 self-study chi-squared multinomial central-limit-theorem

1

Логистическая регрессия против хи-квадрата в таблицах сопряженности 2x2 и Ix2 (однофакторный - двоичный ответ)?

Я пытаюсь понять использование логистической регрессии в таблицах сопряженности 2x2 и Ix2. Например, используя это в качестве примера В чем разница между использованием критерия хи-квадрат и логистической регрессией? Как насчет таблицы с несколькими номинальными коэффициентами (таблица Ix2), например: Существует аналогичный вопрос здесь - но ответ в основном , что хи-квадрат …

10 logistic chi-squared logit contingency-tables

3

G-тест против критерия хи-квадрат Пирсона

Я проверяю независимость в таблице непредвиденных обстоятельствЯ не знаю, лучше ли G-тест или критерий хи-квадрат Пирсона. Размер выборки исчисляется сотнями, но есть небольшое количество клеток. Как указано на странице Википедии , приближение к распределению хи-квадрат лучше для G-теста, чем для теста Пирсона. Но я использую симуляцию Монте-Карло для вычисления значения …

10 chi-squared p-value monte-carlo contingency-tables

2

Как статистика Чи-квадрат Пирсона приближается к распределению Чи-квадрат

Таким образом, если статистика Пиарсона Chi Squared дана для таблицы , то ее форма:1×N1×N1 \times N ∑i=1n(Oi−Ei)2Ei∑i=1n(Oi−Ei)2Ei\sum_{i=1}^n\frac{(O_i - E_i)^2}{E_i} Тогда это приближается к , распределению хи-квадрат с степенями свободы, поскольку размер выборки становится больше. н - 1 нχ2n−1χn−12\chi_{n-1}^2n−1n−1n-1NNN Я не понимаю, как работает это асимптотическое приближение. Я чувствую, что в …

10 chi-squared asymptotics

1

Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние два дают одинаковые ответы. Используя кучу сфабрикованных данных, я обнаружил, …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

2

Доверительный интервал для хи-квадрат

Я пытаюсь найти решение для сравнения двух тестов "хи-квадрат". Точнее, я хочу сравнить результаты двух независимых экспериментов. В этих экспериментах авторы использовали хи-квадрат добротности, чтобы сравнить случайное предположение (ожидаемые частоты) с наблюдаемыми частотами. Два эксперимента получили одинаковое количество участников, и экспериментальные процедуры идентичны, только стимулы изменены. Результаты двух экспериментов показали …

10 r confidence-interval chi-squared

2

Тест хи-квадрат на равенство распределений: сколько нулей он терпит?

Я сравниваю две группы мутантов, каждая из которых может иметь только один из 21 различных фенотипов. Я хотел бы посмотреть, одинаково ли распределение этих результатов между двумя группами. Я нашел онлайн-тест, который вычисляет «критерий хи-квадрат для равенства распределений» и дает мне некоторые правдоподобные результаты. Тем не менее, в этой таблице …

10 distributions chi-squared contingency-tables

4

Как статистически доказать, имеет ли столбец категориальные данные или не использует Python

У меня есть фрейм данных в Python, где мне нужно найти все категориальные переменные. Проверка типа столбца не всегда работает, потому что intтип также может быть категоричным. Поэтому я ищу помощь в поиске правильного метода проверки гипотез, чтобы определить, является ли столбец категоричным или нет. Я пробовал ниже критерия хи-квадрат, …

10 hypothesis-testing categorical-data python chi-squared categorical-encoding

2

Тест независимости против теста гомогенности

Я преподаю базовый курс статистики, и сегодня я рассмотрю критерий независимости по критерию хи-квадрат для двух категорий и критерий однородности. Эти два сценария концептуально различны, но могут использовать одну и ту же статистику теста и распределение. В тесте на однородность предполагается, что предельные итоги для одной из категорий являются частью …

10 chi-squared independence heteroscedasticity teaching

4

Как я могу вычислить статистику теста Пирсона на отсутствие соответствия модели логистической регрессии в R?

Коэффициент отношения правдоподобия (он же отклонение) и критерий несоответствия (или качества соответствия) довольно просто получить для модели логистической регрессии (подгонка с использованием функции) в R. Однако это может быть легко подсчитать количество клеток в конечном итоге достаточно низко, чтобы тест был ненадежным. Один из способов проверить надежность теста отношения правдоподобия …

10 r chi-squared logistic generalized-linear-model goodness-of-fit

Вопросы с тегом «chi-squared»