Вопросы с тегом «sample-size»

Этот тег очень неоднозначен. Используйте его, когда речь идет о размере выборки, и НИЧЕГО из следующего не подходит: [small-sample], [large-data], [power-analysis], [power], [underdetermined] или [unbalanced-classes].

1
Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata
Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata Я получил разные результаты для размеров выборки, а именно: В R power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05) Результат: (т. 161) для каждой группы.n = 160,7777Nзнак равно160.7777n = 160.7777 В стате sampsi 0.70 0.85, …

4
Модель истории дискретного времени (выживания) в R
Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки: ID, …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
Небольшие и несбалансированные размеры выборки для двух групп - что делать?
У меня есть данные для двух групп (то есть выборок), которые я хочу сравнить, но общий размер выборки небольшой (n = 29) и сильно несбалансированный (n = 22 против n = 7). Эти данные сложны с точки зрения логистики и дороги для сбора, поэтому «собрать больше данных» как очевидное решение …

2
Как сделать репрезентативную выборку из большого общего набора данных?
Каковы статистические методы для создания выборочного набора, который является репрезентативным для всего населения (с известным уровнем достоверности)? Также, Как проверить, соответствует ли образец общему набору данных? Возможно ли это без разбора всего набора данных (который может быть миллиардами записей)?

2
Если я хочу с вероятностью 95%, что менее 1% объектов неисправны, сколько образцов мне нужно?
Мне нужно убедиться, что моя карта сайта XML содержит менее мусора (неработающие ссылки). Список URL исчисляется сотнями тысяч, и даже если бы можно было проверить их все 1 на 1, я бы предпочел этого не делать по многим причинам:1 %1%1\% 1 - Saved bandwidth 2 - Faster traffic for real …

1
Вероятно, что образец начальной загрузки точно такой же, как и исходный.
Просто хочу проверить некоторые рассуждения. Если мой исходный образец имеет размер и я загружаю его, то мой мыслительный процесс выглядит следующим образом:Nnn n-11N1n\frac{1}{n} - это шанс любого наблюдения, взятого из исходного образца. Чтобы гарантировать, что следующая ничья не является ранее наблюдавшимся наблюдением, мы ограничиваем размер выборки до . Таким образом, …

4
Как сделать выборку, когда вы не знаете распределение
Я довольно плохо знаком со статистикой (несколько курсов Uni-уровня для начинающих), и мне было интересно узнать о выборках из неизвестных дистрибутивов. В частности, если вы понятия не имеете о базовом дистрибутиве, есть ли способ «гарантировать», что вы получите репрезентативную выборку? Пример для иллюстрации: скажем, вы пытаетесь выяснить глобальное распределение богатства. …

3
Доверительные интервалы против размера выборки?
Я абсолютно новичок в статистике и области доверительных интервалов. Так что это может быть очень тривиально или даже звучать глупо. Я был бы признателен, если бы вы могли помочь мне понять или указать мне литературу / текст / блог, который объясняет это лучше. Я вижу на различных новостных сайтах, таких …

3
Как проверить чрезвычайно низкий уровень ошибок
Я столкнулся с попыткой продемонстрировать путем тестирования чрезвычайно низкого уровня ошибок для датчика (не более 1 ошибки в 1 000 000 попыток). У нас есть ограниченное время для проведения эксперимента, поэтому мы ожидаем, что не сможем получить более 4000 попыток. Я не вижу проблем, показывающих, что датчик не соответствует требованию, …

1
Размер выборки для пропорций в повторных измерениях
Я пытаюсь помочь ученому разработать исследование для выявления микробов сальмонеллы. Он хотел бы сравнить экспериментальную антимикробную композицию с хлором (отбеливателем) на птицефабриках. Поскольку фоновые показатели содержания сальмонеллы различаются с течением времени, он планирует измерить% птицы с сальмонеллой до и после лечения. Таким образом, измерением будет разница до / после% сальмонеллы …

2
Динамический расчет количества образцов, необходимых для оценки среднего
Я пытаюсь оценить среднее значение более или менее гауссовского распределения с помощью выборки. У меня нет предварительных знаний о его значении или его дисперсии. Каждый образец дорогой для получения. Как мне динамически решить, сколько образцов мне нужно, чтобы получить определенный уровень достоверности / точности? Или как узнать, когда я могу …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.