Вопросы с тегом «robust»

Надежность в целом относится к нечувствительности статистики к отклонениям от ее базовых предположений (Huber and Ronchetti, 2009).

1
Надежные методы действительно лучше?
У меня есть две группы субъектов, A и B, каждая из которых имеет размер около 400 и около 300 предикторов. Моя цель - построить модель прогнозирования для бинарной переменной ответа. Мой клиент хочет увидеть результат применения модели, построенной из A на B. (В своей книге «Стратегии регрессионного моделирования», @FrankHarrell упоминает, …

4
Надежный t-критерий для среднего
Я пытаюсь проверить нулевое значение сравнении с локальной альтернативой E [ X ] > 0 для случайной величины X , подверженной небольшому или среднему перекосу и эксцессу случайной величины. Следуя предложениям Уилкокса в «Введении в робастную оценку и проверку гипотез», я рассмотрел тесты, основанные на усеченном среднем, медиане, а также …

1
Надежный PCA против надежного расстояния Махаланобиса для обнаружения выбросов
Надежный PCA (разработанный Candes et al. 2009 или более поздней версии Netrepalli et al 2014 ) является популярным методом многомерного обнаружения выбросов , но расстояние Махаланобиса также можно использовать для обнаружения выбросов с помощью надежной регуляризованной оценки ковариационной матрицы . Мне любопытно (не) преимущества использования одного метода перед другим. Моя …

3
Т-распределение Фиттинга в R: параметр масштабирования
Как мне подобрать параметры t-распределения, то есть параметры, соответствующие «среднему» и «стандартному отклонению» нормального распределения. Я предполагаю, что они называются «среднее» и «масштабирование / степени свободы» для t-распределения? Следующий код часто приводит к ошибкам «сбой оптимизации». library(MASS) fitdistr(x, "t") Нужно ли сначала масштабировать х или преобразовать в вероятности? Как лучше …

1
Определение и сходимость итеративно переоцененных наименьших квадратов
Я использовал итеративно переоцененные наименьшие квадраты (IRLS), чтобы минимизировать функции следующей формы, J(m)=∑Ni=1ρ(|xi−m|)J(m)=∑i=1Nρ(|xi−m|)J(m) = \sum_{i=1}^{N} \rho \left(\left| x_i - m \right|\right) где NNN - количество экземпляров xi∈Rxi∈Rx_i \in \mathbb{R} , m∈Rm∈Rm \in \mathbb{R} - надежная оценка, которую я хочу, а ρρ\rho - подходящая робастная штрафная функция. Допустим, он выпуклый (хотя …

2
Оценка параметров нормального распределения: медиана вместо среднего?
Общий подход для оценки параметров нормального распределения заключается в использовании среднего значения и стандартного отклонения / дисперсии выборки. Однако, если есть некоторые выбросы, медиана и срединное отклонение от медианы должны быть намного более устойчивыми, верно? На некоторых наборах данных я пытался, нормальное распределение , оцененное N(median(x),median|x−median(x)|)N(median(x),median|x−median(x)|)\mathcal{N}(\text{median}(x), \text{median}|x - \text{median}(x)|) , …

1
Почему оценки коэффициента регрессии rlm () отличаются от lm () в R?
Я использую rlm в пакете R MASS для регрессии многомерной линейной модели. Это хорошо работает для ряда образцов, но я получаю квазинулевые коэффициенты для конкретной модели: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit) Residuals: Min 1Q …

3
Ускоренный курс в устойчивой средней оценке
У меня есть куча (около 1000) оценок, и все они должны быть оценками долгосрочной эластичности. Чуть более половины из них оценивается с использованием метода A, а остальные - с использованием метода B. Где-то я читал что-то вроде: «Я думаю, что метод B оценивает что-то очень отличное от метода A, потому …

2
Что такое надежный статистический тест? Что такое мощный статистический тест?
Некоторые статистические тесты являются надежными, а некоторые нет. Что именно означает надежность? Удивительно, но я не смог найти такой вопрос на этом сайте. Более того, иногда надежность и мощь теста обсуждаются вместе. И интуитивно я не мог различить эти два понятия. Что такое мощный тест? Чем он отличается от надежного …

3
Можно ли сделать модели CART надежными?
Коллега в моем офисе сказал мне сегодня: «Модели деревьев не хороши, потому что их ловят экстремальные наблюдения». Поиск здесь привел к этой теме, которая в основном поддерживает претензию. Что приводит меня к вопросу - в какой ситуации модель CART может быть надежной и как это показано?

3
Как рассчитать шкалу оценки Rousseeuw's и Croux '(1993) Qn для больших выборок?
Пусть поэтому для очень короткой выборки, такой как ее можно вычислить от нахождения статики го порядка парных разностей: Qn=Cn.{|Xi−Xj|;i&lt;j}(k)Qn=Cn.{|Xi−Xj|;i&lt;j}(k)Q_n = C_n.\{|X_i-X_j|;i < j\}_{(k)}{1,3,6,2,7,5}{1,3,6,2,7,5}\{1,3,6,2,7,5\}kkk 7 6 5 3 2 1 1 6 5 4 2 1 2 5 4 3 1 3 4 3 2 5 2 1 6 1 7 …

4
Хорошая форма для удаления выбросов?
Я работаю над статистикой для сборок программного обеспечения. У меня есть данные для каждой сборки по пройденному / неудачному и истекшему времени, и мы генерируем ~ 200 из них / неделю. Коэффициент успешности легко агрегируется, я могу сказать, что 45% прошли каждую данную неделю. Но я хотел бы также объединить …

1
Почему бы не использовать надежную регрессию каждый раз?
Примеры этой страницы показывают, что выбросы заметно влияют на простую регрессию, и это можно преодолеть с помощью методов надежной регрессии: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Я считаю, что lmrob и ltsReg - это другие надежные методы регрессии. Почему бы не делать надежную регрессию (например, rlm или rq) каждый раз, а не выполнять простую …

1
Надежная оценка куртоза?
Я использую обычный оценщик для , но я заметилчто даже небольшие «выбросы» в моем эмпирическом распределении, то есть небольшие пики далеко от центра, влияютего чрезвычайно. Существует ли более надежная оценка эксцесса?K^=μ^4σ^4K^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
Надежное многомерное гауссово вписывание в R
Мне нужно согласовать обобщенное распределение Гаусса с 7-мерным облаком точек, содержащим довольно значительное число выбросов с высоким кредитным плечом. Вы знаете какой-нибудь хороший пакет R для этой работы?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.