Вопросы с тегом «sampling»

Создание выборок из хорошо определенной популяции с использованием вероятностного метода и / или создание случайных чисел из указанного распределения. Поскольку этот тег неоднозначен, пожалуйста, рассмотрите [выборку из опроса] для первого и [Монте-Карло] или [симуляцию] для второго. При возникновении вопросов, касающихся создания случайных выборок из известных дистрибутивов, рассмотрите возможность использования тега [random-generation].

4
Вероятность не нарисовать слово из пакета букв в скрэббл
Предположим, у вас была сумка с плитками, на каждой из которых была буква. Есть тайлы с буквой 'A', с 'B' и т. Д., И плитки с «подстановочными знаками» (у нас есть ). Предположим, у вас был словарь с конечным числом слов. Вы выбираете плиток из сумки без замены. Как бы …

8
Как оценить, сколько людей посетило мероприятие (скажем, политический митинг)?
Один студент спросил меня сегодня: «Как они узнают, сколько людей посетили большое групповое мероприятие, например,« Ралли Стюарта / Колберта по восстановлению здравомыслия »в Вашингтоне?» Новостные агентства сообщают, что оценки исчисляются десятками тысяч, но какие методы используются для получения этих оценок и насколько они надежны? Одна статья, очевидно, основывала свою оценку …

2
Чертеж из дистрибутива Дирихле
Допустим, у нас есть распределение Дирихле с мерным векторным параметром . Как я могу нарисовать образец ( мерный вектор) из этого распределения? Мне нужно (возможно) простое объяснение.КKKКα⃗ = [ α1, α2, . , , , αК]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1, \alpha_2,...,\alpha_K]КKK

1
Объяснение конечного поправочного коэффициента
Я понимаю, что, когда выборка из конечной совокупности и нашего размера выборки составляет более 5% совокупности, нам необходимо скорректировать среднее значение выборки и стандартную ошибку, используя эту формулу: FпС= N- нN- 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} Где - размер популяции, а - размер выборки.nNNNNnn У меня есть 3 вопроса по этой формуле: Почему …

1
Расчет предельной вероятности по образцам MCMC
Это повторяющийся вопрос (см. Этот пост , этот пост и этот пост ), но у меня другое вращение. Предположим, у меня есть набор сэмплов из стандартного сэмплера MCMC. Для каждого образца я знаю значение вероятности записи в журнал и предшествующего . Если это помогает, я также знаю значение вероятности записи …

2
Парадокс данных iid (по крайней мере для меня)
Насколько позволяют мои совокупные (и скудные) знания по статистике, я понял, что если - это случайные переменные, то, как следует из этого термина, они независимы и одинаково распределены.X1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_n Здесь меня интересует прежнее свойство примеров iid, которое гласит: p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(X_{n}|X_{i_1},X_{i_2},...,X_{i_k}) = p(X_{n}), для любой коллекции различных s st . 1 …

3
Можно ли анализировать неслучайные выборки с помощью стандартных статистических тестов?
Многие клинические исследования основаны на неслучайных выборках. Однако большинство стандартных тестов (например, t-тесты, ANOVA, линейная регрессия, логистическая регрессия) основаны на предположении, что выборки содержат «случайные числа». Являются ли результаты действительными, если эти неслучайные образцы были проанализированы стандартными тестами? Спасибо.

1
Должна ли выборка для логистической регрессии отражать реальное соотношение 1 и 0?
Предположим, я хочу создать модель логистической регрессии, которая может оценить вероятность появления некоторых видов животных, живущих на деревьях, на основе характеристик деревьев (например, высоты). Как всегда, мое время и деньги ограничены, поэтому я могу собрать только ограниченный размер выборки. У меня есть следующие вопросы: должно ли соотношение 1 и 0 …

2
Генерация данных с заданной выборочной ковариационной матрицей
Учитывая ковариационную матрицу , как сгенерировать данные таким образом, чтобы они имели образец ковариационной матрицы \ hat {\ boldsymbol \ Sigma} = \ boldsymbol \ Sigma_s ?ΣsΣs\boldsymbol \Sigma_sΣ^=ΣsΣ^=Σs\hat{\boldsymbol \Sigma} = \boldsymbol \Sigma_s В более общем плане: мы часто заинтересованы в создании данных из плотности f(x|θ)f(x|θ) f(x \vert \boldsymbol\theta) , причем …

1
Почему выборочное распределение дисперсии является распределением хи-квадрат?
Заявление Распределение выборки дисперсии выборки представляет собой распределение хи-квадрат со степенью свободы, равной , где - размер выборки (учитывая, что интересующая случайная величина обычно распределена).nn−1n−1n-1nnn Источник Моя интуиция Мне это кажется интуитивно понятным: 1) потому что критерий хи-квадрат выглядит как сумма квадратов и 2) потому что распределение хи-квадрат - это …

5
Выборка для несбалансированных данных в регрессии
Были хорошие вопросы об обработке несбалансированных данных в контексте классификации , но мне интересно, что люди делают, чтобы выбрать регрессию. Скажем, проблемный домен очень чувствителен к знаку, но лишь несколько чувствителен к величине цели. Однако величина достаточно важна, чтобы модель представляла собой регрессию (непрерывная цель), а не классификацию (положительные и …

7
Может ли кто-нибудь помочь объяснить разницу между независимым и случайным?
В статистике описывают ли независимые и случайные одинаковые характеристики? Какая разница между ними? Мы часто сталкиваемся с описанием типа «две независимые случайные величины» или «случайная выборка». Мне интересно, какова точная разница между ними. Может кто-нибудь объяснить это и привести несколько примеров? например, независимый, но случайный процесс?

1
Bootstrapping vs Bayesian Bootstrapping концептуально?
У меня проблемы с пониманием, что такое байесовский процесс начальной загрузки, и чем он отличается от вашей обычной начальной загрузки. И если бы кто-то мог предложить интуитивно-концептуальный обзор и сравнение того и другого, это было бы здорово. Давайте возьмем пример. Скажем, у нас есть набор данных X, который [1,2,5,7,3]. Если …

1
Я только что изобрел байесовский метод для анализа кривых ROC?
преамбула Это длинный пост. Если вы перечитываете это, обратите внимание, что я пересмотрел часть вопроса, хотя исходные материалы остались прежними. Кроме того, я считаю, что разработал решение проблемы. Это решение появляется в нижней части поста. Спасибо CliffAB за то, что он указал, что мое оригинальное решение (отредактировано из этого поста; …

4
Как спроецировать новый вектор на пространство PCA?
После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли главные компоненты в этой матрице …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.