Вопросы с тегом «computational-statistics»

Относится к интерфейсу статистики и вычислений; использование алгоритмов и программного обеспечения в статистических целях.

1
Решение замкнутой формы задачи Лассо, когда матрица данных диагональна
\newcommand{\diag}{\operatorname{diag}} У нас проблема: при условии, что: \ sum_ {я = 1} ^ nx_ix_i ^ T = \ диаг (\ sigma_1 ^ 2, ..., \ sigma_d ^ 2).minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),\min_{w\in\mathbb{R}^{d}}\left( \frac{1}{n}\sum_{i=1}^{n} \left( \langle w,x_{i}\rangle-y_{i} \right)^{2} +2\lambda||w||_1\right),∑i=1nxixTi=diag(σ21,...,σ2d).∑i=1nxixiT=diag⁡(σ12,...,σd2).\sum_{i=1}^nx_ix_i^T=\diag(\sigma_1^2,...,\sigma_d^2). Есть ли в этом случае решение в замкнутой форме? У меня есть это: (XTX)−1=diag(σ−21,...,σ−2d),(XTX)−1=diag⁡(σ1−2,...,σd−2),(X^TX)^{-1}=\diag\left(\sigma_1^{-2},...,\sigma_d^{-2}\right), и поэтому …

7
Осмысление теории статистики и приложений
Я недавно закончил со степенью магистра по медицинскому и биологическому моделированию, сопровождаемый инженерной математикой в ​​качестве фона. Несмотря на то, что моя образовательная программа включала в себя значительное количество курсов по математической статистике (список приведен ниже), которыми я руководил с довольно высокими оценками, я часто полностью терял взгляд на теорию …

1
Как я могу оптимизировать вычислительную эффективность при многократной подгонке сложной модели к большому набору данных?
У меня проблемы с производительностью при использовании MCMCglmmпакета в R для запуска модели смешанных эффектов. Код выглядит так: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn, verbose=F) В данных содержится около 20 000 наблюдений, которые сгруппированы примерно в 200 школах. Я удалил все неиспользуемые переменные из фрейма данных и …

4
Обнаружение выбросов во временных рядах: как уменьшить количество ложных срабатываний?
Я пытаюсь автоматизировать обнаружение выбросов во временных рядах, и я использовал модификацию решения, предложенного здесь Робом Хиндманом . Скажем, я измеряю ежедневные посещения сайта из разных стран. В некоторых странах, где ежедневные посещения составляют несколько сотен или тысяч, мой метод, кажется, работает разумно. Однако в тех случаях, когда страна ведет …

3
Использование компьютерного моделирования для лучшего понимания статистических концепций на уровне выпускника
Привет, я прохожу аспирантуру по статистике, и мы освещали тестовую статистику и другие концепции. Тем не менее, я часто могу применять формулы и развивать своего рода интуицию о том, как все работает, но у меня часто возникает ощущение, что, возможно, если я подкреплю свое исследование симуляцией экспериментов, я разовью лучшую …

1
Что это за «максимальный коэффициент корреляции»?
Типичная статистика обработки изображений - это использование текстурных характеристик Харалика , которых 14. Я задаюсь вопросом о 14-й из этих функций: учитывая карту смежности (которую мы можем просто посмотреть на эмпирическое распределение двух целых чисел ), она определяется как: квадратный корень из второго собственного значения , где это:i , j …

1
Найти сопоставимую контрольную группу для группы лечения?
У меня есть группа лечения размером 30 (30 школ в Калифорнии), которая использовала дополнительное математическое программное обеспечение. В простом анализе я хотел бы сравнить средний рост математики учащихся между нашей группой лечения и сопоставимой контрольной группой. Есть много школ в CA, которые не использовали программное обеспечение. Я бы хотел, чтобы …

2
Обратная ковариационная матрица против ковариационной матрицы в PCA
В PCA, имеет ли значение, если мы выбираем главные компоненты обратной ковариационной матрицы ИЛИ, если мы отбрасываем собственные векторы ковариационной матрицы, соответствующие большим собственным значениям? Это связано с обсуждением в этом посте .

3
Возможно ли в R (или вообще) заставить коэффициенты регрессии быть определенным знаком?
Я работаю с некоторыми реальными данными, и регрессионные модели дают противоречивые результаты. Обычно я доверяю статистике, но на самом деле некоторые из этих вещей не могут быть правдой. Основная проблема, которую я вижу, состоит в том, что увеличение одной переменной вызывает увеличение отклика, когда на самом деле они должны иметь …

1
Быстрое вычисление / оценка линейной системы низкого ранга
Линейные системы уравнений распространены в вычислительной статистике. Одна особая система, с которой я столкнулся (например, в факторном анализе), это система A x = bAx=bAx=b где Здесь D - диагональная матрица n × n со строго положительной диагональю, Ω - симметричная положительная полуопределенная матрица m × m (с m ≪ n …

4
Тестирование статистического программного обеспечения
Какие методы / подходы полезны при тестировании статистического программного обеспечения? Мне особенно интересны программы, которые выполняют параметрическую оценку с максимальной вероятностью. Сравнение результатов с результатами других программ или опубликованных источников не всегда возможно, так как большую часть времени, когда я пишу собственную программу, это происходит потому, что необходимые мне вычисления …

4
Почему требуется градиентный спуск?
Когда мы можем дифференцировать функцию стоимости и найти параметры, решая уравнения, полученные посредством частичного дифференцирования по каждому параметру, и выяснить, где функция стоимости минимальна. Также я думаю, что можно найти несколько мест, где производные равны нулю, поэтому мы можем проверить все такие места и найти глобальные минимумы почему вместо этого …

2
Как сделать выборку из дискретного распределения по неотрицательным целым числам?
У меня есть следующее дискретное распределение, где - известные константы:α,βα,β\alpha,\beta p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,…p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,… p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x = 0,1,2,\dots Каковы некоторые подходы для эффективной выборки из этого распределения?

3
Обнаружение аномалий временных рядов с помощью Python
Мне нужно реализовать обнаружение аномалий в нескольких наборах данных временных рядов. Я никогда не делал этого раньше и надеялся на некоторые советы. Я очень хорошо разбираюсь в python, поэтому я бы предпочел, чтобы в нем было реализовано решение (большая часть моего кода - это python для других частей моей работы). …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.