Вопросы с тегом «population»

Популяция - это весь набор единиц, из которых может быть составлена ​​выборка.

12
Почему 95% доверительный интервал (КИ) не подразумевает 95% вероятности удержания среднего значения?
Похоже, что из-за различных связанных с этим вопросов существует консенсус, что «95%» часть того, что мы называем «95% доверительный интервал», относится к тому факту, что если бы мы точно повторяли наши процедуры выборки и вычисления CI много раз 95% рассчитанных таким образом КИ будут содержать среднее значение для населения. Также …

25
Нахождение свободно доступных образцов данных
Я работал над новым методом анализа и анализа наборов данных, чтобы идентифицировать и изолировать подгруппы населения без предварительного знания характеристик какой-либо подгруппы. Хотя этот метод достаточно хорошо работает с искусственными выборками данных (то есть наборами данных, созданными специально для идентификации и разделения подмножеств населения), я хотел бы попробовать протестировать его …

5
В чем разница между N и N-1 в расчете дисперсии населения?
Я не понял, почему есть Nи N-1при расчете дисперсии населения. Когда мы используем Nи когда мы используем N-1? Нажмите здесь, чтобы увеличить версию Это говорит о том, что когда население очень большое, нет разницы между N и N-1, но это не говорит о том, почему существует N-1 в начале. Изменить: …

5
Статистический вывод, когда выборка «является» населением
Представьте, что вы должны составлять отчеты о количестве кандидатов, которые ежегодно сдают данный тест. Кажется довольно сложным сделать вывод о наблюдаемом проценте успеха, например, для более широкой популяции из-за специфики целевой популяции. Таким образом, вы можете считать, что эти данные представляют все население. Действительно ли результаты тестов показывают, что пропорции …


3
Статистические методы для данных, где известно только минимальное / максимальное значение
Существует ли какая-либо ветвь статистики, имеющая дело с данными, для которых точные значения неизвестны , но для каждого человека мы знаем максимальную или минимальную привязку к значению ? Я подозреваю, что моя проблема в основном связана с тем, что я изо всех сил пытаюсь сформулировать ее в статистических терминах, но, …

3
Оценка численности населения по частоте выборки дубликатов и уникальных
Есть веб-сервис, где я могу запросить информацию о случайном предмете. Для каждого запроса каждый элемент имеет равные шансы на возврат. Я могу продолжать запрашивать предметы и записывать количество дубликатов и уникальных. Как я могу использовать эти данные для оценки общего количества товаров?


4
Является ли какое-либо количественное свойство населения «параметром»?
Я относительно знаком с различием между терминами статистика и параметр. Я вижу статистику как значение, полученное от применения функции к образцу данных. Однако большинство примеров параметров относятся к определению параметрического распределения. Типичным примером является среднее значение и стандартное отклонение для параметризации нормального распределения или коэффициентов и дисперсии ошибок для параметризации …

1
Пакет GBM против Карет с использованием GBM
Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в качестве метрики оценки. Я хочу найти оптимальную производительность …

1
Шахматисты мужского и женского пола - ожидаемые расхождения в хвостах раздач
Я заинтересован в выводах этой статьи за 2009 год: Почему (лучшие) женщины так хороши в шахматах? Уровень участия и гендерные различия в интеллектуальных сферах В этой статье делается попытка объяснить, почему самые лучшие шахматисты выглядят намного лучше, чем самые лучшие игроки женского пола (женщины составляют всего 2% из 1000 лучших …

2
Уклон в среднем возрасте для квалификации звания гроссмейстера по возрастным группам?
Уже давно известно, что самый молодой возраст, когда шахматистам удавалось претендовать на звание гроссмейстера, значительно уменьшился с 1950-х годов, и в настоящее время почти 30 игроков стали гроссмейстерами до своего 15-летия . Однако на бирже шахматных стеков возникает вопрос: каков средний возраст, чтобы стать гроссмейстером? , Кто-то опубликовал ответ, для …

2
Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности?
Имеет ли смысл рассчитывать доверительные интервалы и проверять гипотезы, когда доступны данные по всей совокупности? На мой взгляд, ответ - нет, поскольку мы можем точно рассчитать истинные значения параметров. Но тогда, какова максимальная доля данных от первоначального населения, которая позволяет нам использовать вышеупомянутые методы?

1
R линейная регрессия категориальной переменной «скрытое» значение
Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод, заданный R, будет выглядеть примерно …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Оценка количества шаров путем последовательного выбора шара и его маркировки
Допустим, у меня в сумке N шаров. На моем первом розыгрыше я отмечаю мяч и помещаю его в сумку. Во время второго розыгрыша, если я беру отмеченный мяч, я возвращаю его в сумку. Однако, если я беру безымянный шарик, я отмечаю его и возвращаю в сумку. Я продолжаю это для …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.