Вопросы с тегом «statistical-significance»

Статистическая значимость относится к вероятности того, что, если бы в популяции, из которой была выбрана эта выборка, истинный эффект был равен 0 (или некоторому предполагаемому значению), то могла бы иметь место статистика теста как экстремальная или более экстремальная, чем та, которая была получена в выборке.

3
Может ли метаанализ исследований, которые «не являются статистически значимыми», привести к «существенному» заключению?
Мета-анализ включает в себя ряд исследований, все из которых сообщили о значении P, превышающем 0,05. Возможно ли для общего метаанализа сообщить значение P менее 0,05? При каких обстоятельствах? (Я почти уверен, что ответ - да, но мне нужна ссылка или объяснение.)

3
Может ли ANOVA быть значимым, если ни один из парных t-тестов не является?
Возможно ли для одностороннего (с группами или «уровнями») ANOVA сообщить о существенной разнице, когда ни один из парных t-тестов не делает?N ( N - 1 ) / 2N> 2N>2N>2N( N- 1 ) / 2N(N−1)/2N(N-1)/2 В этом ответе @whuber писал: Хорошо известно, что глобальный тест ANOVA F может обнаружить разницу средних …

1
Вычисление повторяемости эффектов по модели Лмера
Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

8
Обилие значений Р при отсутствии гипотезы
Я в эпидемиологии. Я не статистика, но я пытаюсь выполнить анализ самостоятельно, хотя я часто сталкиваюсь с трудностями. Я сделал свой первый анализ около 2 лет назад. Значения P были включены повсеместно в мои анализы (я просто делал то, что делали другие исследователи) от описательных таблиц до регрессионного анализа. Постепенно …

1
Могут ли степени свободы быть нецелым числом?
Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
Что вызывает разрыв в распределении опубликованных значений р при р <0,05?
В недавней работе Masicampo и Lalande (ML) собрали большое количество p-значений, опубликованных во многих различных исследованиях. Они наблюдали любопытный скачок в гистограмме значений p прямо на каноническом критическом уровне 5%. Есть хорошая дискуссия об этом явлении ML в блоге профессора Вассермана: http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/ В его блоге вы найдете гистограмму: Поскольку уровень …

1
Можно ли распространить критерий Мантеля на асимметричные матрицы?
Тест Мантеля обычно применяется к симметричным матрицам расстояний / разностей. Насколько я понимаю, предположение теста состоит в том, что мера, используемая для определения различий, должна быть, по крайней мере, полуметрической (соответствовать стандартным требованиям метрики, но не неравенству треугольника). Может ли предположение о симметрии быть ослаблено (давая предварительную метрику)? Можно ли …

4
Ziliak (2011) выступает против использования p-значений и упоминает некоторые альтернативы; кто они такие?
В недавней статье, обсуждающей недостатки использования p-значения для статистического вывода, под названием «Matrixx v. Siracusano and Student v. Fisher Статистическая значимость в испытании» (DOI: 10.1111 / j.1740-9713.2011.00511.x), Стивен Т. Зиляк выступает против использования р-значений. В заключительных параграфах он говорит: Данные это единственное, что мы уже знаем, и наверняка. То, что …

3
Почему работает тест Колмогорова-Смирнова?
Читая о тесте KS с двумя образцами, я точно понимаю, что он делает, но я не понимаю, почему он работает . Другими словами, я могу выполнить все шаги для вычисления эмпирических функций распределения, найти максимальную разницу между ними, чтобы найти D-статистику, вычислить критические значения, преобразовать D-статистику в p-значение и т. …

4
Исправление значений p для нескольких тестов, где тесты коррелированы (генетика)
У меня есть p значений из многих тестов, и я хотел бы знать, есть ли на самом деле что-то существенное после исправления для множественного тестирования. Сложность: мои тесты не являются независимыми. Метод, о котором я думаю (вариант метода продукта Фишера, Зайкин и др., Genet Epidemiol , 2002), нуждается в корреляции …

4
Биномиальный тест с двумя пропорциями выборки в R (и некоторые странные p-значения)
Я пытаюсь решить следующий вопрос: Игрок A выиграл 17 из 25 игр, а игрок B выиграл 8 из 20 - есть ли значительная разница между обоими соотношениями? В R приходит на ум следующее: &gt; prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction data: c(17, 8) out of c(25, …

3
Безопасное определение размера образца для A / B-тестирования
Я - инженер-программист, желающий создать инструмент A / B-тестирования . У меня нет основательной статистики, но за последние несколько дней я немного читал. Я следую методологии, описанной здесь, и суммирую соответствующие пункты ниже. Этот инструмент позволит дизайнерам и экспертам по доменам настраивать веб-сайт для разделения трафика, получаемого по определенному URL-адресу, …

4
Почему линейная регрессия и ANOVA дают различное
Я пытался подогнать данные одного временного ряда (без повторов), используя регрессионную модель. Данные выглядят следующим образом: &gt; xx.2 value time treat 1 8.788269 1 0 2 7.964719 6 0 3 8.204051 12 0 4 9.041368 24 0 5 8.181555 48 0 6 8.041419 96 0 7 7.992336 144 0 8 …

5
Оценка значимости различий в распределениях
У меня есть две группы данных. Каждый с различным распределением нескольких переменных. Я пытаюсь определить, отличаются ли распределения этих двух групп статистически значимым образом. У меня есть данные как в необработанном виде, так и сгруппированные в более легкие для работы с дискретными категориями с частотными показателями в каждой. Какие тесты …

3
Сравнение и противопоставление, p-значения, уровни значимости и ошибка типа I
Мне было интересно, если кто-нибудь мог бы дать краткое изложение в отношении определений и использования значений p, уровня значимости и ошибки типа I. Я понимаю, что значения p определяются как «вероятность получения тестовой статистики, по крайней мере, такой же экстремальной, как та, которую мы наблюдали на самом деле», тогда как …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.