Вопросы с тегом «mixture»

Распределение смеси - это распределение, которое записывается как выпуклая комбинация других распределений. Используйте тег «составные-распределения» для «конкатенации» распределений (где параметр распределения сам по себе является случайной величиной).

1
Пакеты Python для работы с моделями гауссовых смесей (GMM)
Кажется, есть несколько вариантов для работы с моделями гауссовых смесей (GMM) в Python. На первый взгляд есть как минимум: PyMix - http://www.pymix.org/pymix/index.php Инструменты для моделирования смесей PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, которая является частью набора инструментов Scipy и, кажется, фокусируется на обновлении GMM : теперь известно как sklearn.mixture . PyPR - http://pypr.sourceforge.net/ …

2
Правильное использование и интерпретация моделей с нулевой раздувкой
Фон: я биостатист, в настоящее время борюсь с набором данных о клеточной экспрессии. В ходе исследования некоторые пептиды подвергались воздействию множества клеток, собранных группами от различных доноров. Клетки либо экспрессируют определенные биомаркеры в ответ, либо нет. Частота ответов затем записывается для каждой группы доноров. Частота ответов (выраженная в процентах) является …

2
Точная выборка из неправильных смесей
Предположим, я хочу сделать выборку из непрерывного распределения . Если у меня есть выражение в видерp(x)p(x)p(x)ppp p(x)=∑i=1∞aifi(x)p(x)=∑i=1∞aifi(x)p(x) = \sum_{i=1}^\infty a_i f_i(x) где и f_i - это распределения, из которых можно легко брать выборки, тогда я могу легко сгенерировать выборки из p :ai⩾0,∑iai=1ai⩾0,∑iai=1a_i \geqslant 0, \sum_i a_i= 1 рfifif_ippp Выборка метки …

1
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?
Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою модель, чтобы я мог использовать его для целей …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Длиннохвостое распределение временных событий
Предположим, у вас есть журналы веб-сервера. В этих журналах у вас есть кортежи такого типа: user1, timestamp1 user1, timestamp2 user1, timestamp3 user2, timestamp4 user1, timestamp5 ... Эти временные метки представляют, например, клики пользователей. Теперь, мы user1будем посещать сайт несколько раз (сессий) в течение месяца, и у вас будут всплески кликов …

1
Оптимальное количество компонентов в гауссовой смеси
Таким образом, получение «идеи» об оптимальном количестве кластеров в k-средних хорошо документировано. Я нашел статью о том, как сделать это в гауссовых смесях, но не уверен, что меня это убедило, я не очень хорошо понимаю. Есть ли ... более мягкий способ сделать это?

1
Сходимость по алгоритму EM с двумерным распределением смеси
У меня есть смешанная модель, в которой я хочу найти оценку максимального правдоподобия для данного набора данных и набора частично наблюдаемых данных . Я реализовал и E-шаг (вычисление ожидания учетом и текущих параметров ), и M-шаг, чтобы минимизировать отрицательное логарифмическое правдоподобие с учетом ожидаемого .z z x θ k zxxxzzzzzzxxxθkθk\theta^kzzz …

1
Визуализация результатов от нескольких скрытых моделей классов
Я использую скрытый анализ классов для кластеризации выборки наблюдений на основе набора двоичных переменных. Я использую R и пакет poLCA. В LCA необходимо указать количество кластеров, которые вы хотите найти. На практике люди обычно запускают несколько моделей, каждая из которых задает разное количество классов, а затем используют различные критерии, чтобы …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.