Статистика и большие данные p-value

2

Как строго обосновать выбранные коэффициенты ложноположительных / ложноотрицательных ошибок и базовое соотношение затрат?

контекст Группа социологов и статистиков ( Benjamin et al., 2017 ) недавно предположила, что типичный ложноположительный показатель ( = .05), используемый в качестве порога для определения «статистической значимости», должен быть скорректирован до более консервативного порога. ( = .005). Противоборствующая группа социологов и статистиков ( Lakens et al., 2018 ) ответила, …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Неправильно ли выбирать функции на основе p-значения?

Есть несколько постов о том, как выбирать функции. Один из методов описывает важность функции на основе t-статистики. В R, varImp(model)примененном к линейной модели со стандартизованными характеристиками, используется абсолютное значение t-статистики для каждого параметра модели. Итак, в основном мы выбираем функцию на основе ее t-статистики, то есть, насколько точным является коэффициент. …

12 regression p-value feature-selection

5

Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Ступенчатая регрессия в R - Критическое значение p

Какое критическое значение p используется step()функцией в R для ступенчатой регрессии? Я предполагаю, что это 0,15, но верно ли мое предположение? Как я могу изменить критическое значение p?

12 r regression p-value stepwise-regression

1

Если распределение тестовой статистики является бимодальным, означает ли p-значение что-либо?

Р-значение определяется вероятностью получения тест-статистики, по крайней мере, такой же экстремальной, как и наблюдаемая, при условии, что нулевая гипотеза верна. Другими словами, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Но что если тест-статистика является бимодальной по распределению? означает ли p-значение что-либо в этом контексте? Например, я собираюсь смоделировать некоторые бимодальные …

12 hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

2

Как я могу объединить загруженные p-значения через множественные вмененные наборы данных?

Я обеспокоен проблемой, состоящей в том, что я хотел бы запустить p-значение для оценки из данных с множественным вменением (MI), но мне неясно, как объединить p-значения в наборах MI.θθ\theta Для наборов данных MI стандартный подход для получения полной дисперсии оценок использует правила Рубина. Смотрите здесь для обзора объединения наборов данных …

12 confidence-interval variance p-value bootstrap multiple-imputation

4

В R как вычислить значение p для площади под ROC

Я изо всех сил пытаюсь найти способ вычислить значение p для области под характеристикой оператора приемника (ROC). У меня есть непрерывная переменная и результат диагностического теста. Я хочу посмотреть, является ли AUROC статистически значимым. Я нашел много пакетов, имеющих дело с кривыми ROC: pROC, ROCR, caTools, верификация, Epi. Но даже …

12 r p-value roc

1

Путаница с lmer и p-значениями: как p-значения из пакета memisc сравниваются с MCMC?

У меня сложилось впечатление, что функция lmer()в lme4пакете не производит p-значения (см. lmerP-значения и все такое ). Я использую MCMC сгенерированных значений р вместо как на этот вопрос: Значительный эффект в lme4смешанной модели и на этот вопрос: Не удается найти р-значения в выводе из lmer()в lm4пакете вR . Недавно я …

12 r mixed-model p-value mcmc lme4-nlme

2

Можно ли вычислить p-значения для корреляционного теста Пирсона только из коэффициента корреляции и размера выборки?

Предыстория: я прочитал одну статью, где авторы сообщают о корреляции Пирсона 0,754 от размера выборки 878. Результирующее значение p для корреляционного теста является значимым «две звезды» (т. Е. Р <0,01). Тем не менее, я думаю, что при таком большом размере выборки соответствующее значение p должно быть меньше 0,001 (т. Е. …

12 hypothesis-testing correlation p-value fraud

2

Регулировка значения p для адаптивного последовательного анализа (для теста хи-квадрат)?

Я хотел бы знать, какая статистическая литература имеет отношение к следующей проблеме, и, возможно, даже идея о том, как ее решить. Представьте себе следующую проблему: У нас есть 4 возможных лечения некоторых заболеваний. Чтобы проверить, какое лечение лучше, мы проводим специальное исследование. В испытании мы начинаем с отсутствия субъектов, затем, …

12 hypothesis-testing chi-squared p-value multiple-comparisons sequential-analysis

2

Статистический тест для положительной и отрицательной прогностической ценности

Я читал газету и увидел таблицу со сравнением между PPV (положительная прогностическая ценность) и NPV (отрицательная прогностическая ценность). Они сделали какой-то статистический тест для них, это эскиз таблицы: PPV NPV p-value 65.9 100 < 0.00001 ... Каждая строка относится к конкретной таблице непредвиденных обстоятельств. Какой тип проверки гипотезы они сделали? …

12 epidemiology contingency-tables p-value

1

Почему lm и biglm в R дают разные значения p для одних и тех же данных?

Вот небольшой пример: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) Теперь с base::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738 3.491 0.0732 . x -1.3800 0.3191 …

12 r regression p-value linear-model

1

Точный критерий Фишера дает неоднородные p-значения

Я пытаюсь применить точный критерий Фишера в задаче с имитацией генетики, но значения p кажутся искаженными вправо. Будучи биологом, я думаю, я просто упускаю что-то очевидное для каждого статистика, поэтому я был бы очень признателен за вашу помощь. Моя установка такова: (настройка 1, маргиналы не фиксированы) Две выборки 0 и …

12 p-value fishers-exact

2

понимание р-значения в множественной линейной регрессии

Что касается p-значения множественного линейного регрессионного анализа, введение с веб-сайта Minitab приведено ниже. Значение p для каждого члена проверяет нулевую гипотезу о том, что коэффициент равен нулю (без эффекта). Низкое значение p (<0,05) означает, что вы можете отклонить нулевую гипотезу. Другими словами, предиктор с низким значением p, скорее всего, станет …

12 multiple-regression p-value

1

Доверительный интервал и неопределенность P-значения для теста перестановки

Я сейчас изучаю рандомизированные тесты. Мне на ум приходят два вопроса: Да, легко и интуитивно понятно, как значение p вычисляется с помощью теста рандомизации (который, я думаю, совпадает с тестом перестановки?). Тем не менее, как мы можем также генерировать 95% доверительный интервал, как мы делаем с обычными параметрическими тестами? Когда …

12 confidence-interval p-value permutation-test

Вопросы с тегом «p-value»