Вопросы с тегом «hypothesis-testing»

Проверка гипотез оценивает, не являются ли данные несовместимыми с данной гипотезой, а не являются ли они результатом случайных колебаний.

1
В чем разница между wilcox.test и coin :: wilcox_test в R?
Эти две функции существуют в R, но я не знаю их различий. Кажется, что они возвращают одинаковые p-значения только при вызове wilcox.testс correct=FALSE, и wilcox_test(в пакете для монет) с distribution="aymptotic". Для других значений они возвращают разные p-значения. Также wilcox.testвсегда возвращает W = 0 для моего набора данных, независимо от настроек …


3
Разница между односторонним и двусторонним тестированием?
Во время учебы по курсу статистики я пытался понять разницу между односторонними и двусторонними проверками гипотез. В частности, почему односторонний тест отклоняет нулевое значение, а двусторонний - нет? Пример:

2
Как проверить, соответствует ли выборка данных гамма-распределению?
У меня есть выборка данных, которые были сгенерированы из непрерывной случайной величины X. И из гистограммы, которую я рисую с использованием R, я предполагаю, что, возможно, распределение X подчиняется определенному гамма-распределению. Но я не знаю точных параметров этого гамма-распределения. Мой вопрос заключается в том, как проверить, принадлежит ли распределение X …

2
Использование теста статистической значимости для проверки результатов кластерного анализа
Я изучаю использование статистической значимости (SST) для проверки результатов кластерного анализа. Я нашел несколько статей по этой теме, таких как « Статистическая значимость кластеризации для данных большого размера с малым размером выборки », Liu, Yufeng et al. (2008) « О некоторых тестах значимости в кластерном анализе », Бок (1985) Но …

1
Тест на значимость разности коэффициента корреляции Спирмена
(Большое спасибо за быстрые ответы! Я плохо задал вопрос, поэтому позвольте мне повторить.) Я не знаю, как выяснить, является ли разница между двумя корреляциями Спирмена статистически значимой. Я хотел бы знать, как это выяснить. Причина, которую я хотел выяснить, заключается в том, что в следующей статье: Основанная на Википедии семантическая …

5
Можно ли использовать квадрат Чи для сравнения пропорций?
Я читал, что тест хи-квадрат полезен, чтобы увидеть, значительно ли образец отличается от набора ожидаемых значений. Например, вот таблица результатов опроса относительно любимых цветов людей (всего n = 15 + 13 + 10 + 17 = 55 респондентов): red,blue,green,yellow 15,13,10,17 Тест хи-квадрат может сказать мне, значительно ли этот образец отличается …

1
LARS против координатного спуска для лассо
Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи также будут оценены. редактировать: так как я разместил вопрос, chl любезно указал …

4
Сравнение хвостов двух выборочных распределений
У меня есть два набора данных, которые примерно сосредоточены вокруг нуля, но я подозреваю, что у них разные хвосты. Я знаю несколько тестов для сравнения дистрибутива с нормальным дистрибутивом, но я бы хотел сравнить два этих дистрибутива. Существует ли простой тест для сравнения жирности хвоста из 2 распределений ? Спасибо, …

1
Тестирование двух независимых образцов на ноль с одинаковым перекосом?
Какие тесты доступны для тестирования двух независимых выборок для нулевой гипотезы о том, что они происходят из популяций с одинаковым перекосом? Существует классический 1-выборочный тест для определения того, равняется ли перекос фиксированному числу (тест включает 6-й момент выборки!); есть ли прямой перевод для теста с двумя образцами? Существуют ли методы, …

1
Пакет GBM против Карет с использованием GBM
Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в качестве метрики оценки. Я хочу найти оптимальную производительность …

2
Как определить область отказа, когда нет UMP?
Рассмотрим модель линейной регрессии ,y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} ,u∼N(0,σ2I)u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) .E(u∣X)=0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} Пусть против H 1 : σ 2 0 ≠ σ 2 .H0:σ20=σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1:σ20≠σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 Мы можем сделать вывод, что , гдеdim(X)=n×k. ИМХявляется типичным для обозначения матрицы аннуляторного,МXу= у , где у является зависимой переменнойурегрессировали наX.yTMXyσ2∼χ2(n−k)yTMXyσ2∼χ2(n−k)\frac{\mathbf{y}^T\mathbf{M_X}\mathbf{y}}{\sigma^2}\sim \chi^2(n-k)dim(X)=n×kdim(X)=n×kdim(\mathbf{X})=n\times kMXMX\mathbf{M_X}MXy=y^MXy=y^\mathbf{M_X}\mathbf{y}=\hat{\mathbf{y}}y^y^ \hat{\mathbf{y}}yy\mathbf{y}XX\mathbf{X} Книга, которую я читаю, …

2
Вы наблюдаете k голов из n бросков. Честная ли монета?
Мне задали этот вопрос с в интервью. Есть ли «правильный» ответ?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Предположим, что броски одинаковы, а вероятность голов составляет p=0.5p=0.5p=0.5 . Распределение числа голов в 400 бросках должно быть близко к нормальному (200, 10 ^ 2), так что 220 голов - это 2 стандартных отклонения от …

4
Что делать, если значения двух образцов существенно различаются, но разница кажется слишком маленькой, чтобы иметь значение
У меня есть два образца ( в обоих случаях). Средство отличается примерно вдвое от объединенного стандартного. девиация Результирующее значение T составляет приблизительно 10. Хотя приятно знать, что я убедительно показал, что средние значения не одинаковы, мне кажется, это обусловлено большим n. Глядя на гистограммы данных, я, конечно, не чувствую, что, …

3
Как проверить, изменилась ли ковариационная матрица за два момента времени?
Моя задача - проверить, есть ли изменение ковариационной матрицы из 6 переменных. Значения 6 переменных измеряются дважды от одного и того же субъекта (3 года между измерениями). Как я могу это сделать? Я делал большую часть своей работы, используя SAS.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.