Вопросы с тегом «sample-size»

Этот тег очень неоднозначен. Используйте его, когда речь идет о размере выборки, и НИЧЕГО из следующего не подходит: [small-sample], [large-data], [power-analysis], [power], [underdetermined] или [unbalanced-classes].

14
Являются ли большие наборы данных неподходящими для проверки гипотез?
В недавней статье в Amstat Новости , авторы (Марк ван дер Лан и Шерри Роуз) заявил , что «Мы знаем , что для достаточно больших размеров выборки, каждое исследование, в том числе те , в которых нулевая гипотеза об отсутствии эффекта верно - будет объявить статистически значимый эффект. Ну, я, …

3
Имеет ли значение несбалансированный образец при выполнении логистической регрессии?
Итак, я думаю, что у меня есть достаточно приличная выборка, принимая во внимание эмпирическое правило 20: 1: довольно большая выборка (N = 374) для в общей сложности 7 потенциальных переменных-предикторов. Моя проблема заключается в следующем: независимо от того, какой набор переменных предикторов я использую, классификации никогда не становятся лучше, чем …

7
Эмпирические правила для минимального размера выборки для множественной регрессии
В рамках предложения по исследованию социальных наук мне был задан следующий вопрос: Я всегда использовал 100 + m (где m - количество предикторов) при определении минимального размера выборки для множественной регрессии. Это уместно? Я часто получаю похожие вопросы, часто с разными правилами. Я также очень много читал такие практические правила …

10
Существует ли минимальный размер выборки, необходимый для того, чтобы t-тест был действительным?
В настоящее время я работаю над квази-экспериментальной исследовательской работой. У меня размер выборки только 15 из-за низкой численности населения в выбранной области, и только 15 соответствуют моим критериям. Является ли 15 минимальным размером выборки для t-теста и F-теста? Если так, где я могу получить статью или книгу, чтобы поддержать этот …

2
Как следует интерпретировать сравнение средств из разных размеров выборки?
Возьмите случай с рейтингами книг на сайте. Книгу А оценивают 10000 человек со средним рейтингом 4,25 и дисперсией . Точно так же книга B оценивается 100 людьми и имеет рейтинг 4,5 с .σ=0.5σ=0.5\sigma = 0.5σ=0.25σ=0.25\sigma = 0.25 Теперь из-за большого размера выборки Книги А «среднее значение стабилизировалось» до 4,25. Теперь …

5
Что мы можем сказать о средней численности населения из выборки 1?
Мне интересно, что мы можем сказать, если вообще что-нибудь, о значении населения, когда у меня есть только одно измерение, (размер выборки 1). Очевидно, мы хотели бы иметь больше измерений, но мы не можем их получить.y 1μμ\muy1y1y_1 Мне кажется, что поскольку среднее значение выборки, , тривиально равно , то . Однако …

4
Какие ссылки следует привести, чтобы использовать 30 как достаточно большой размер выборки?
Я много раз читал / слышал, что размер выборки, по крайней мере, 30 единиц, считается «большой выборкой» (предположения о нормальности средств обычно приблизительно соответствуют CLT, ...). Поэтому в своих экспериментах я обычно генерирую образцы по 30 единиц. Можете ли вы дать мне некоторые ссылки, которые должны быть указаны при использовании …

10
Почему 600 из 1000 убедительнее, чем 6 из 10?
Взгляните на этот отрывок из «Руководства по обучению», Palgrave, 2012, Стеллы Коттрелл, стр. 155: Процентное внимание Обратите внимание, когда проценты даны. Предположим, вместо этого приведенное выше утверждение гласит: 60% людей предпочитали апельсины; 40% сказали, что предпочитают яблоки. Это выглядит убедительно: числовые величины даны. Но есть разница между 60% и 40% …

2
Определение размера выборки, необходимого для метода начальной загрузки / Предлагаемый метод
Я знаю, что это довольно горячая тема, на которую никто не может дать простой ответ. Тем не менее мне интересно, если следующий подход не может быть полезным. Метод начальной загрузки полезен только в том случае, если ваша выборка более или менее (читай точно) соответствует тому же распределению, что и исходная …

5
Почему политические опросы имеют такой большой размер выборки?
Когда я смотрел новости, я заметил, что опросы Гэллапа по таким вещам, как президентские выборы, имеют [я предполагаю случайный] выборочный размер более 1000. Из того, что я помню из статистики колледжа, было то, что размер выборки 30 был «значительно большим». Было сделано впечатление, что размер выборки более 30 бессмыслен из-за …

4
Минимальный размер выборки для PCA или FA, когда основной целью является оценка только нескольких компонентов?
Если у меня есть набор данных с наблюдениями и переменными (измерениями), и, как правило, мало ( ), и может варьироваться от маленького ( ) до, возможно, гораздо большего ( ).p n n = 12 - 16 p p = 4 - 10 p = 30 - 50nNnpppnnnn=12−16n=12−16n=12-16pppp=4−10p=4−10p = 4-10p=30−50p=30−50p= 30-50 …

7
Каково минимальное рекомендуемое количество групп для фактора случайных эффектов?
Я использую смешанную модель в R( lme4) для анализа некоторых данных повторных измерений. У меня есть переменная реакции (содержание волокна в кале) и 3 фиксированных эффекта (масса тела и т. Д.). В моем исследовании всего 6 участников, по 16 повторных измерений для каждого (хотя у двух только 12 повторений). Субъектами …

6
Размер выборки для логистической регрессии?
Я хочу сделать логистическую модель из моих данных опроса. Это небольшой опрос четырех жилых колоний, в котором было опрошено только 154 респондента. Моя зависимая переменная - «удовлетворительный переход к работе». Я обнаружил, что из 154 респондентов 73 сказали, что они успешно перешли на работу, а остальные нет. Таким образом, зависимая …

3
Проверка работоспособности: насколько низким может быть значение p?
Я использую тест ranksum для сравнения медианы двух образцов ( ) и обнаружили , что они значительно отличаются с: . Должен ли я с подозрением относиться к такому маленькому значению или мне следует отнести его к высокой статистической мощности, связанной с наличием очень большой выборки? Есть ли такая вещь, как …

9
Как выяснить, какой тип распределения представляет эти данные о времени отклика ping?
Я пробовал реальный процесс, время пинга в сети. «Время прохождения туда-обратно» измеряется в миллисекундах. Результаты представлены на гистограмме: Время пинга имеет минимальное значение, но длинный верхний хвост. Я хочу знать, что это за статистическое распределение, и как оценить его параметры. Несмотря на то, что дистрибутив не является нормальным, я все …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.