Статистика и большие данные generalized-linear-model

1

Биномиальный блеск с категориальной переменной с полным успехом

Я использую glmm с биномиальной переменной ответа и категориальным предиктором. Случайный эффект дается вложенным дизайном, используемым для сбора данных. Данные выглядят так: m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein m.gen1$emergence [1] 1 0 0 1 0 1 1 1 1 1 1 0 0.... …

11 r generalized-linear-model lme4-nlme separation

3

GLM с непрерывными данными, накопленными в нуле

Я пытаюсь использовать модель для оценки того, насколько катастрофические заболевания, такие как туберкулез, СПИД и т. Д., Влияют на расходы на госпитализацию. У меня есть «стоимость госпитализации» в качестве зависимой переменной и различные индивидуальные маркеры в качестве независимых переменных, почти все из которых являются фиктивными, такими как пол, глава семьи, …

11 generalized-linear-model zero-inflation ordered-logit regression-strategies

1

Всегда ли существует каноническая функция связи для обобщенной линейной модели (GLM)?

В GLM предполагается скаляр YYY и θθ\theta для базового распределения с pdf еY( у| θ,τ) = ч ( у, т) опыт( θ у- A ( θ )d( τ))fY(y|θ,τ)=h(y,τ)exp⁡(θy−A(θ)d(τ))f_Y(y | \theta, \tau) = h(y,\tau) \exp{\left(\frac{\theta y - A(\theta)}{d(\tau)} \right)} Можно показать, чтоμ=E(Y)=A′(θ)μ=E⁡(Y)=A′(θ) \mu = \operatorname{E}(Y) = A'(\theta). Если функция связиg(⋅)g(⋅)g(\cdot)удовлетворяет следующему:g(μ)=θ=X′βg(μ)=θ=X′βg(\mu)=\theta …

11 generalized-linear-model exponential-family

4

Логистическая регрессия и точка перегиба

У нас есть данные с двоичным результатом и некоторыми ковариатами. Я использовал логистическую регрессию для моделирования данных. Просто простой анализ, ничего необычного. Предполагается, что конечным результатом будет кривая доза-эффект, где мы показываем, как изменяется вероятность для конкретного ковариата. Что-то вроде этого: Мы получили некоторую критику от внутреннего рецензента (не чисто …

11 regression logistic generalized-linear-model binary-data

1

Функция стоимости для проверки моделей регрессии Пуассона

Для собранных данных я использую регрессию Пуассона для построения моделей. Я делаю это с помощью glmфункции в R, где я использую family = "poisson". Для оценки возможных моделей (у меня есть несколько предикторов) я использую AIC. Все идет нормально. Теперь я хочу выполнить перекрестную проверку. Я уже преуспел в этом, …

11 r generalized-linear-model poisson-distribution

2

Анализ обогащения по уровню дупликации генов

Биологический Фон Со временем некоторые виды растений имеют тенденцию дублировать свои полные геномы, получая дополнительную копию каждого гена. Из-за нестабильности этой установки многие из этих генов затем удаляются, и геном перестраивается и стабилизируется, готовый к повторному дублированию. Эти события дублирования связаны с событиями видообразования и вторжения, и теория заключается в …

11 generalized-linear-model contingency-tables fishers-exact genetics bioinformatics

1

Могут ли эти данные быть объединены в пропорции для биномиального глм?

Мы попросили 60 человек перечислить как можно больше ресторанных франшиз в Атланте. Общий список включал более 70 ресторанов, но мы исключили те, которые были упомянуты менее чем 10% людей, оставив нам 45. Для этих 45 мы рассчитали долю информантов, которые перечислили франшизу, и нас интересует моделирование этой пропорции в зависимости …

11 r generalized-linear-model

2

Параметр дисперсии в выходных данных GLM

Я запустил glm в R, и в нижней части summary()вывода, он заявляет (Dispersion parameter for gaussian family taken to be 28.35031) Я покопался в Google и узнал, что параметр дисперсии используется для соответствия стандартным ошибкам. Я надеюсь, что кто-то может предоставить более подробную информацию о том, что такое параметр дисперсии …

11 r generalized-linear-model

1

Приспособление Пуассона GLM в R - проблемы с показателями по сравнению с количеством

В настоящее время я работаю над проектом, включающим в себя GLM (и, в конечном итоге, GAM), некоторые данные подсчета времени. Обычно я делаю это в SAS, но я пытаюсь перейти на R, и у меня возникают ... проблемы. Когда я подхожу к GLM для подсчета данных, используя следующее: cdi_model <- …

11 r poisson-distribution generalized-linear-model

1

Как я могу адаптировать ANOVA для двоичных данных?

У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который представляет собой процент правильных прогнозов для каждой из моделей. Мне кажется, что я …

11 anova chi-squared generalized-linear-model

1

R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?

mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и ti(x1) + ti(x2) + ti(x1, x2)может дать (немного) разные результаты. MWE …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

2

Что на самом деле вычисляет формула y ~ x + 0 в R?

Какова статистическая разница между выполнением линейной регрессии в R с formulaнабором y ~ x + 0вместо y ~ x? Как мне интерпретировать эти два разных результата?

11 multiple-regression generalized-linear-model intercept

1

OLS vs. Poisson GLM с идентификационной связью

Мой вопрос показывает мое плохое понимание регрессии Пуассона и GLM в целом. Вот некоторые поддельные данные, чтобы проиллюстрировать мой вопрос: ### some fake data x=c(1:14) y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45) Некоторые пользовательские функции для возврата psuedo-R2: ### functions of pseudo-R2 psuR2 …

11 generalized-linear-model poisson-distribution

1

Как выбрать вероятность отсечения для редкого события Логистическая регрессия

У меня есть 100 000 наблюдений (9 фиктивных переменных индикатора) с 1000 положительных результатов. Логистическая регрессия должна работать нормально в этом случае, но вероятность отсечения озадачивает меня. В обычной литературе мы выбираем 50% -ное сокращение, чтобы предсказать 1 и 0. Я не могу этого сделать, так как моя модель дает …

11 regression logistic classification generalized-linear-model roc

1

Тест отношения правдоподобия и тест Вальда дают разные выводы для glm в R

Я воспроизводлю пример из обобщенных, линейных и смешанных моделей . Мой MWE ниже: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <- glm(formula=NoPositive/NoofPlates~log(Dilution), family=binomial("logit"), …

11 r logistic generalized-linear-model likelihood-ratio z-test

Вопросы с тегом «generalized-linear-model»