Вопросы с тегом «bootstrap»

Начальная загрузка - это метод повторной выборки для оценки распределения выборки статистики.

2
Как построить 95% доверительный интервал разницы между медианами?
Моя проблема: параллельное групповое рандомизированное исследование с очень искаженным распределением первичного результата. Я не хочу предполагать нормальность и использовать 95% ДИ, основанные на норме (то есть, используя 1,96 X SE). Мне удобно выражать меру центральной тенденции как медиану, но мой вопрос заключается в том, как построить 95% -е ДИ разницы …

4
Почему RANSAC не наиболее широко используется в статистике?
Исходя из области компьютерного зрения, я часто использовал метод RANSAC (Random Sample Consensus) для подгонки моделей к данным с большим количеством выбросов. Тем не менее, я никогда не видел, чтобы он использовался статистиками, и у меня всегда было впечатление, что его не считают «статистически обоснованным» методом. Почему это так? Это …

1
Есть ли результат, который обеспечивает загрузку является действительным, если и только если статистика гладкая?
Во всем мы предполагаем, что наша статистика является функцией некоторых данных которые взяты из функции распределения ; Эмпирическая функция распределения нашей выборки - . Таким образом, - это статистика, рассматриваемая как случайная величина, а - это версия статистики для начальной загрузки. Мы используем в качестве расстояния KSX 1 , ... …

1
Можно ли охарактеризовать многочлен (1 / n,…, 1 / n) как дискретный Дирихле (1, .., 1)?
Так что этот вопрос немного запутанный, но я добавлю красочные графики, чтобы восполнить это! Сначала предыстория, затем вопрос (ы). Задний план Скажем, у вас есть мерное полиномиальное распределение с равными вероятностями по категориям. Пусть - нормализованные значения ( ) из этого распределения, то есть:nnnnnnπ=(π1,…,πn)π=(π1,…,πn)\pi = (\pi_1, \ldots, \pi_n)ccc (c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c_1, \ldots, …

3
Перекрестная проверка или начальная загрузка для оценки эффективности классификации?
Какой метод выборки является наиболее подходящим для оценки производительности классификатора на конкретном наборе данных и сравнения его с другими классификаторами? Перекрестная проверка кажется стандартной практикой, но я читал, что такие методы, как .632 начальной загрузки, являются лучшим выбором. В качестве продолжения: влияет ли выбор метрики производительности на ответ (если я …

2
Как на самом деле работает самозагрузка в R?
Я изучал загрузочный пакет в R, и хотя я нашел несколько хороших учебников по его использованию, мне еще предстоит найти что-то, что точно описывает то, что происходит "за кулисами". Например, в этом примере руководство показывает, как использовать стандартные коэффициенты регрессии в качестве отправной точки для регрессии начальной загрузки, но не …

1
Bootstrapping vs Bayesian Bootstrapping концептуально?
У меня проблемы с пониманием, что такое байесовский процесс начальной загрузки, и чем он отличается от вашей обычной начальной загрузки. И если бы кто-то мог предложить интуитивно-концептуальный обзор и сравнение того и другого, это было бы здорово. Давайте возьмем пример. Скажем, у нас есть набор данных X, который [1,2,5,7,3]. Если …

1
Два способа использования бутстрапа для оценки доверительного интервала коэффициентов в регрессии
Я применяю линейную модель к своим данным: yi=β0+β1xi+ϵi,ϵi∼N(0,σ2).yi=β0+β1xi+ϵi,ϵi∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Я хотел бы оценить доверительный интервал (CI) коэффициентов ( , \ beta_ {1} ), используя метод начальной загрузки. Есть два способа применения метода начальной загрузки: β 1β0β0\beta_{0}β1β1\beta_{1} Выборка парного ответа-предиктора: Произвольная повторная выборка пар Yя- хяyi−xiy_{i}-x_{i} и применение …

2
Самозагрузка - нужно ли сначала удалять выбросы?
Мы запустили сплит-тест новой функции продукта и хотим оценить, является ли увеличение выручки значительным. Наши наблюдения, как правило, не распределяются нормально (большинство наших пользователей не тратят, а среди тех, кто их тратит, они сильно отклоняются от множества мелких и очень больших расходов). Мы решили использовать начальную загрузку для сравнения средств, …

1
Использование стандартной ошибки дистрибутива начальной загрузки
(при необходимости игнорируйте код R, так как мой главный вопрос не зависит от языка) Если я хочу посмотреть на изменчивость простой статистики (например, среднее), я знаю, что могу сделать это с помощью теории, например: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) …

3
Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке?
Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке? Я понимаю, что здесь часто используются методы начальной загрузки, но я открыт для других вариантов. В то время как я ищу непараметрическую опцию, если кто-то может убедить меня, что параметрическое решение является действительным, это было бы хорошо. Размер …

1
Использование начальной загрузки под H0 для проведения теста на разницу двух средств: замена в группах или в объединенном образце
Предположим, у меня есть данные с двумя независимыми группами: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c …

2
Среднее из начальной загрузки выборки против статистики выборки
Скажем, у меня есть образец и образец начальной загрузки из этого образца для стастита (например, среднее значение). Как все мы знаем, эта самозагрузки образец оценивает на распределение выборки из оценки из статистики.χχ\chi Теперь, является ли среднее значение этой выборки начальной загрузки лучшей оценкой статистики популяции, чем статистика исходной выборки ? …

1
Доверительный интервал на основе бутстрэпа
Изучая доверительный интервал на основе бутстрапа, я однажды прочитал следующее утверждение: Если распределение начальной загрузки перекошено вправо, основанный на начальной загрузке доверительный интервал включает поправку для перемещения конечных точек еще дальше вправо; это может показаться нелогичным, но это правильное действие. Я пытаюсь понять логику, лежащую в основе приведенного выше утверждения.

3
Зачем нам нужна самозагрузка?
В настоящее время я читаю «Все статистические данные» Ларри Вассермана и озадачен тем, что он написал в главе об оценке статистических функций непараметрических моделей. Он написал «Иногда мы можем найти оценочную стандартную ошибку статистической функции, выполнив некоторые вычисления. Однако в других случаях не очевидно, как оценить стандартную ошибку». Я хотел …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.