Вопросы с тегом «bootstrap»

Начальная загрузка - это метод повторной выборки для оценки распределения выборки статистики.

1
Требуется ли центрирование при начальной загрузке образца?
Читая о том, как приблизить распределение выборки, я наткнулся на непараметрический метод начальной загрузки. По- видимому, можно аппроксимировать распределение распределения ˉ Х * п - ˉ Х п , где ˉ Х * п обозначает образец среднего значения выборки начальной загрузки.Икс¯N- μИкс¯N-μ\bar{X}_n-\muИкс¯*N- Х¯NИкс¯N*-Икс¯N\bar{X}_n^*-\bar{X}_nИкс¯*NИкс¯N*\bar{X}_n^* Мой вопрос: мне нужно центрирование? Зачем? Разве …

1
Является ли начальная загрузка допустимым методом для оценки неопределенности средней оценки?
Начальная загрузка работает хорошо, чтобы получить доступ к неопределенности в средней оценке, однако я помню, что где-то чтение начальной загрузки не помогло оценить неопределенность в квантильных оценках (особенно медиана). Я не помню, где я читал это, и я не мог найти много с быстрым поиском Google. Мысли об этом и …

3
Как мне сравнить загрузочные наклоны регрессии?
Предположим, у меня есть два набора данных с n наблюдениями пар данных независимой переменной x и зависимой переменной y каждый. Предположим далее, что я хочу сгенерировать распределение наклонов регрессии для каждого набора данных путем начальной загрузки наблюдений (с заменой) N раз и вычисления регрессии y = a + bxкаждый раз. …

2
Понимание начальной загрузки для проверки и выбора модели
Мне кажется, я понимаю, как работают основы самозагрузки , но я не уверен, что понимаю, как я могу использовать самозагрузку для выбора модели или чтобы избежать переобучения. Например, для выбора модели вы бы просто выбрали модель, которая дает наименьшую ошибку (может быть, дисперсию?) Во всех выборках начальной загрузки? Существуют ли …

2
Осложнения наличия очень маленькой выборки в модели структурного уравнения
Я использую модель структурного уравнения (SEM) в Amos 18. Я искал 100 участников для моего эксперимента (использовался свободно), которого, вероятно, было недостаточно для успешного проведения SEM. Мне неоднократно говорили, что SEM (наряду с EFA, CFA) является статистической процедурой "большой выборки". Короче говоря, я не добрался до 100 участников (какой сюрприз!), …

1
Тестирование двух независимых образцов на ноль с одинаковым перекосом?
Какие тесты доступны для тестирования двух независимых выборок для нулевой гипотезы о том, что они происходят из популяций с одинаковым перекосом? Существует классический 1-выборочный тест для определения того, равняется ли перекос фиксированному числу (тест включает 6-й момент выборки!); есть ли прямой перевод для теста с двумя образцами? Существуют ли методы, …

1
Оценки «Приблизительно нормально» для t-тестов
Я проверяю равенство средств, используя t-критерий Уэлча. Базовое распределение далеко от нормального (более искажено, чем пример в соответствующем обсуждении здесь ). Я могу получить больше данных, но хотел бы найти принципиальный способ определить, в какой степени это сделать. Существует ли хорошая эвристика для оценки приемлемости распределения выборки? Какие отклонения от …

1
Существуют ли современные способы использования джекнифинга?
Вопрос: Bootstrapping превосходит джекнифинг; однако мне интересно, есть ли случаи, когда джекнифинг является единственным или, по крайней мере, жизнеспособным вариантом для характеристики неопределенности из оценок параметров. Кроме того, в практических ситуациях, насколько предвзятый / неточный джекнифинг по сравнению с начальной загрузкой, и могут ли результаты ножевого ножа обеспечить предварительное понимание …

1
Почему бы не всегда использовать загрузочные CI?
Мне было интересно, как загрузочные CI (и BCa в barticular) работают на нормально распределенных данных. Похоже, что было проделано много работы по изучению их производительности в различных типах дистрибутивов, но ничего не удалось найти в нормально распределенных данных. Поскольку кажется очевидным, что изучать в первую очередь, я полагаю, что бумаги …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Как выполнить тест начальной загрузки, чтобы сравнить средства двух образцов?
У меня есть две сильно искаженные выборки, и я пытаюсь использовать начальную загрузку, чтобы сравнить их с помощью t-статистики. Как правильно это сделать? Процесс, который я использую Я обеспокоен целесообразностью использования стандартной ошибки исходных / наблюдаемых данных на последнем этапе, когда я знаю, что это обычно не распространяется. Вот мои …

2
Как я могу объединить загруженные p-значения через множественные вмененные наборы данных?
Я обеспокоен проблемой, состоящей в том, что я хотел бы запустить p-значение для оценки из данных с множественным вменением (MI), но мне неясно, как объединить p-значения в наборах MI.θθ\theta Для наборов данных MI стандартный подход для получения полной дисперсии оценок использует правила Рубина. Смотрите здесь для обзора объединения наборов данных …

2
Когда использовать бутстрап против байесовской техники?
У меня довольно сложная проблема анализа решений, связанная с проверкой надежности, и логический подход (для меня), похоже, предполагает использование MCMC для поддержки байесовского анализа. Тем не менее, было высказано предположение, что было бы более целесообразно использовать подход начальной загрузки. Может ли кто-нибудь предложить ссылку (или три), которые могут поддержать использование …

1
Расчет доверительных интервалов с помощью начальной загрузки на основе зависимых наблюдений
Бутстрап в его стандартной форме может использоваться для расчета доверительных интервалов оценочной статистики при условии, что наблюдения выполнены. I. Visser и соавт. в « Доверительных интервалах для скрытых параметров модели Маркова » использовался параметрический загрузчик для расчета КЭ для параметров НММ. Однако, когда мы подгоняем HMM к последовательности наблюдений, мы …

2
Можем ли мы использовать образцы начальной загрузки, которые меньше исходного?
Я хочу использовать начальную загрузку для оценки доверительных интервалов для оценочных параметров из набора панельных данных с N = 250 фирмами и T = 50 месяцем. Оценка параметров является вычислительно дорогой (несколько дней вычислений) из-за использования фильтрации Калмана и сложной нелинейной оценки. Поэтому отбор (с заменой) B (сотнями и более) …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.