Статистика и большие данные sample-size

1

Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata

Сравнение пропорций с двумя выборками, оценка размера выборки: R против Stata Я получил разные результаты для размеров выборки, а именно: В R power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05) Результат: (т. 161) для каждой группы.n = 160,7777Nзнак равно160.7777n = 160.7777 В стате sampsi 0.70 0.85, …

10 r stata sample-size power-analysis jmp

4

Модель истории дискретного времени (выживания) в R

Я пытаюсь вписать модель с дискретным временем в R, но я не уверен, как это сделать. Я читал, что вы можете организовать зависимую переменную в разных строках, по одной для каждого временного наблюдения, и использовать glmфункцию со ссылкой logit или cloglog. В этом смысле, у меня есть три колонки: ID, …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

2

Небольшие и несбалансированные размеры выборки для двух групп - что делать?

У меня есть данные для двух групп (то есть выборок), которые я хочу сравнить, но общий размер выборки небольшой (n = 29) и сильно несбалансированный (n = 22 против n = 7). Эти данные сложны с точки зрения логистики и дороги для сбора, поэтому «собрать больше данных» как очевидное решение …

10 t-test sample-size

2

Как сделать репрезентативную выборку из большого общего набора данных?

Каковы статистические методы для создания выборочного набора, который является репрезентативным для всего населения (с известным уровнем достоверности)? Также, Как проверить, соответствует ли образец общему набору данных? Возможно ли это без разбора всего набора данных (который может быть миллиардами записей)?

10 sampling sample-size validation

2

Если я хочу с вероятностью 95%, что менее 1% объектов неисправны, сколько образцов мне нужно?

Мне нужно убедиться, что моя карта сайта XML содержит менее мусора (неработающие ссылки). Список URL исчисляется сотнями тысяч, и даже если бы можно было проверить их все 1 на 1, я бы предпочел этого не делать по многим причинам:1 %1%1\% 1 - Saved bandwidth 2 - Faster traffic for real …

9 probability confidence-interval sample-size

1

Вероятно, что образец начальной загрузки точно такой же, как и исходный.

Просто хочу проверить некоторые рассуждения. Если мой исходный образец имеет размер и я загружаю его, то мой мыслительный процесс выглядит следующим образом:Nnn n-11N1n\frac{1}{n} - это шанс любого наблюдения, взятого из исходного образца. Чтобы гарантировать, что следующая ничья не является ранее наблюдавшимся наблюдением, мы ограничиваем размер выборки до . Таким образом, …

9 sampling bootstrap sample-size subsampling

4

Как сделать выборку, когда вы не знаете распределение

Я довольно плохо знаком со статистикой (несколько курсов Uni-уровня для начинающих), и мне было интересно узнать о выборках из неизвестных дистрибутивов. В частности, если вы понятия не имеете о базовом дистрибутиве, есть ли способ «гарантировать», что вы получите репрезентативную выборку? Пример для иллюстрации: скажем, вы пытаетесь выяснить глобальное распределение богатства. …

9 distributions estimation sampling sample-size algorithms

3

Доверительные интервалы против размера выборки?

Я абсолютно новичок в статистике и области доверительных интервалов. Так что это может быть очень тривиально или даже звучать глупо. Я был бы признателен, если бы вы могли помочь мне понять или указать мне литературу / текст / блог, который объясняет это лучше. Я вижу на различных новостных сайтах, таких …

9 confidence-interval sample-size

3

Как проверить чрезвычайно низкий уровень ошибок

Я столкнулся с попыткой продемонстрировать путем тестирования чрезвычайно низкого уровня ошибок для датчика (не более 1 ошибки в 1 000 000 попыток). У нас есть ограниченное время для проведения эксперимента, поэтому мы ожидаем, что не сможем получить более 4000 попыток. Я не вижу проблем, показывающих, что датчик не соответствует требованию, …

9 survival sample-size quality-control

1

Размер выборки для пропорций в повторных измерениях

Я пытаюсь помочь ученому разработать исследование для выявления микробов сальмонеллы. Он хотел бы сравнить экспериментальную антимикробную композицию с хлором (отбеливателем) на птицефабриках. Поскольку фоновые показатели содержания сальмонеллы различаются с течением времени, он планирует измерить% птицы с сальмонеллой до и после лечения. Таким образом, измерением будет разница до / после% сальмонеллы …

9 sample-size repeated-measures proportion

2

Динамический расчет количества образцов, необходимых для оценки среднего

Я пытаюсь оценить среднее значение более или менее гауссовского распределения с помощью выборки. У меня нет предварительных знаний о его значении или его дисперсии. Каждый образец дорогой для получения. Как мне динамически решить, сколько образцов мне нужно, чтобы получить определенный уровень достоверности / точности? Или как узнать, когда я могу …

9 estimation sample-size

Вопросы с тегом «sample-size»