Вопросы с тегом «zero-inflation»

Чрезмерные 0 в переменной по сравнению с указанным эталонным распределением. Подходы регрессии включают модели с нулевым раздувом и модели с препятствиями (из 2 частей). Для данных подсчета распространены модели с нулевым надуванием и барьером, основанные на пуассоновском или отрицательном биномиальном распределении (ZIP / ZINB и HP / HNB).

4
Диагностические участки для подсчета регрессии
Какие диагностические графики (и, возможно, формальные тесты) вы считаете наиболее информативными для регрессий, где результат представляет собой переменную счета? Я особенно заинтересован в пуассоновских и отрицательных биномиальных моделях, а также в аналогах с нулевой раздувкой и препятствием каждой из них. Большинство источников, которые я обнаружил, просто наносят графики остатков в …

4
В чем разница между моделями с нулевой раздувкой и препятствиями?
Интересно, есть ли четкая разница между так называемыми распределениями с нулевым раздуванием (моделями) и так называемыми распределениями с барьером в нуле (моделями)? Термины встречаются в литературе довольно часто, и я подозреваю, что они не совпадают, но не могли бы вы объяснить мне разницу в простых терминах?

3
Пример: регрессия LASSO с использованием glmnet для двоичного результата
Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Является ли «модель препятствий» действительно одной моделью? Или только две отдельные, последовательные модели?
Рассмотрим модель препятствий, прогнозирующую данные подсчета yот обычного предиктора x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 В этом случае у меня есть данные счета …

1
Когда использовать данные Пуассона против геометрических и отрицательных биномиальных GLM для данных подсчета?
Я пытаюсь сделать макет для себя, когда уместно использовать тип регрессии (геометрический, пуассоновский, отрицательный бином) с данными счета в рамках GLM (только 3 из 8 распределений GLM используются для данных счета, хотя большая часть того, что Я читал центры вокруг отрицательных биномиальных и пуассоновских распределений). Когда использовать данные Пуассона против …

4
Работа с 0,1 значениями в бета-регрессии
У меня есть некоторые данные в [0,1], которые я хотел бы проанализировать с помощью бета-регрессии. Конечно, что-то нужно сделать, чтобы приспособить значения 0,1. Мне не нравится изменять данные, чтобы соответствовать модели. Кроме того, я не верю, что нулевая и 1 инфляция - это хорошая идея, потому что я считаю, что …

5
Бета-регрессия данных о пропорциях, включая 1 и 0
Я пытаюсь создать модель, для которой у меня есть переменная ответа, которая составляет пропорцию между 0 и 1, это включает довольно много 0 и 1, но также и много значений между ними. Я думаю о попытке бета-регрессии. Пакет, который я нашел для R (betareg), допускает только значения в диапазоне от …

2
Почему именно бета-регрессия не может иметь дело с 0 и 1 в переменной ответа?
Бета-регрессия (т. Е. GLM с бета-распределением и, как правило, функцией логит-линка) часто рекомендуется для работы с зависимостью, называемой зависимой переменной, принимающей значения от 0 до 1, такие как дроби, соотношения или вероятности: регрессия для результата (соотношение или дробь) между 0 и 1 . Однако всегда утверждается, что бета-регрессия не может …

3
Ноль-завышенная отрицательная биномиальная модель смешанных эффектов в R
Существует ли такой пакет, который обеспечивает нулевую раздувание отрицательной биномиальной оценки модели смешанных эффектов в R? Под этим я подразумеваю: Нулевая инфляция, где вы можете указать биномиальную модель для нулевой инфляции, как в функции zeroinfl в пакете pscl: zeroinfl (y ~ X | Z, dist = "negbin") где Z - …

1
Как смоделировать неотрицательные данные с нулевой раздувкой?
В настоящее время я пытаюсь применить линейную модель ( family = gaussian) к индикатору биоразнообразия, который не может принимать значения ниже нуля, имеет нулевое раздувание и непрерывен. Значения варьируются от 0 до чуть более 0,25. Как следствие, в остатках модели есть довольно очевидная закономерность, от которой мне не удалось избавиться: …

3
Может ли модель для неотрицательных данных со сгущением в нули (Tweedie GLM, нулевое раздувание GLM и т. Д.) Предсказать точные нули?
Распределение Твиди может моделировать искаженные данные с точечной массой в нуле, когда параметр (показатель степени в отношении средней дисперсии) находится между 1 и 2.pпp Точно так же модель с нулевой раздувкой (будь то непрерывная или дискретная) может иметь большое количество нулей. У меня возникают проблемы с пониманием, почему, когда я …

3
Нулевые раздутые распределения, что они на самом деле?
Я изо всех сил пытаюсь понять ноль раздутых распределений. Кто они такие? В чем смысл? Если у меня есть данные со многими нулями, то я мог бы подогнать логистическую регрессию, сначала вычислить вероятность нулей, а затем я мог бы удалить все нули, а затем подобрать регулярную регрессию, используя мой выбор …

1
Нулевая инфляция Пуассона
Предположим, что независимы иY=(Y1,…,Yn)′Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! } Также предположим, что параметры и p = ( p 1 , … , p …

1
Не можете найти подходящую модель для подсчета данных со смешанными эффектами - ZINB или что-то еще?
У меня есть очень маленький набор данных о численности одиночной пчелы, который мне трудно анализировать. Это данные подсчета, и почти все подсчеты находятся в одной обработке, а большинство нулей в другой обработке. Есть также пара очень высоких значений (по одному на двух из шести сайтов), поэтому распределение подсчетов имеет очень …

2
Как настроить пуассон с нулевой раздувкой в ​​JAGS?
Я пытаюсь настроить модель Пуассона с нулевой раздувкой в ​​R и JAGS. Я новичок в JAGS, и мне нужно некоторое руководство о том, как это сделать. Я пытался со следующим, где у [я] является наблюдаемой переменной model { for (i in 1:I) { y.null[i] <- 0 y.pois[i] ~ dpois(mu[i]) pro[i] …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.