Вопросы с тегом «generalized-linear-model»

Обобщение линейной регрессии, учитывающее нелинейные отношения с помощью «функции связи» и дисперсии отклика, зависящей от прогнозируемого значения. (Не путать с «общей линейной моделью», которая расширяет обычную линейную модель до общей ковариационной структуры и многомерного отклика.)

1
Биномиальный блеск с категориальной переменной с полным успехом
Я использую glmm с биномиальной переменной ответа и категориальным предиктором. Случайный эффект дается вложенным дизайном, используемым для сбора данных. Данные выглядят так: m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein m.gen1$emergence [1] 1 0 0 1 0 1 1 1 1 1 1 0 0.... …

3
GLM с непрерывными данными, накопленными в нуле
Я пытаюсь использовать модель для оценки того, насколько катастрофические заболевания, такие как туберкулез, СПИД и т. Д., Влияют на расходы на госпитализацию. У меня есть «стоимость госпитализации» в качестве зависимой переменной и различные индивидуальные маркеры в качестве независимых переменных, почти все из которых являются фиктивными, такими как пол, глава семьи, …

1
Всегда ли существует каноническая функция связи для обобщенной линейной модели (GLM)?
В GLM предполагается скаляр YYY и θθ\theta для базового распределения с pdf еY( у| θ,τ) = ч ( у, т) опыт( θ у- A ( θ )d( τ))fY(y|θ,τ)=h(y,τ)exp⁡(θy−A(θ)d(τ))f_Y(y | \theta, \tau) = h(y,\tau) \exp{\left(\frac{\theta y - A(\theta)}{d(\tau)} \right)} Можно показать, чтоμ=E(Y)=A′(θ)μ=E⁡(Y)=A′(θ) \mu = \operatorname{E}(Y) = A'(\theta). Если функция связиg(⋅)g(⋅)g(\cdot)удовлетворяет следующему:g(μ)=θ=X′βg(μ)=θ=X′βg(\mu)=\theta …

4
Логистическая регрессия и точка перегиба
У нас есть данные с двоичным результатом и некоторыми ковариатами. Я использовал логистическую регрессию для моделирования данных. Просто простой анализ, ничего необычного. Предполагается, что конечным результатом будет кривая доза-эффект, где мы показываем, как изменяется вероятность для конкретного ковариата. Что-то вроде этого: Мы получили некоторую критику от внутреннего рецензента (не чисто …

1
Функция стоимости для проверки моделей регрессии Пуассона
Для собранных данных я использую регрессию Пуассона для построения моделей. Я делаю это с помощью glmфункции в R, где я использую family = "poisson". Для оценки возможных моделей (у меня есть несколько предикторов) я использую AIC. Все идет нормально. Теперь я хочу выполнить перекрестную проверку. Я уже преуспел в этом, …

2
Анализ обогащения по уровню дупликации генов
Биологический Фон Со временем некоторые виды растений имеют тенденцию дублировать свои полные геномы, получая дополнительную копию каждого гена. Из-за нестабильности этой установки многие из этих генов затем удаляются, и геном перестраивается и стабилизируется, готовый к повторному дублированию. Эти события дублирования связаны с событиями видообразования и вторжения, и теория заключается в …

1
Могут ли эти данные быть объединены в пропорции для биномиального глм?
Мы попросили 60 человек перечислить как можно больше ресторанных франшиз в Атланте. Общий список включал более 70 ресторанов, но мы исключили те, которые были упомянуты менее чем 10% людей, оставив нам 45. Для этих 45 мы рассчитали долю информантов, которые перечислили франшизу, и нас интересует моделирование этой пропорции в зависимости …

2
Параметр дисперсии в выходных данных GLM
Я запустил glm в R, и в нижней части summary()вывода, он заявляет (Dispersion parameter for gaussian family taken to be 28.35031) Я покопался в Google и узнал, что параметр дисперсии используется для соответствия стандартным ошибкам. Я надеюсь, что кто-то может предоставить более подробную информацию о том, что такое параметр дисперсии …

1
Приспособление Пуассона GLM в R - проблемы с показателями по сравнению с количеством
В настоящее время я работаю над проектом, включающим в себя GLM (и, в конечном итоге, GAM), некоторые данные подсчета времени. Обычно я делаю это в SAS, но я пытаюсь перейти на R, и у меня возникают ... проблемы. Когда я подхожу к GLM для подсчета данных, используя следующее: cdi_model <- …

1
Как я могу адаптировать ANOVA для двоичных данных?
У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который представляет собой процент правильных прогнозов для каждой из моделей. Мне кажется, что я …

1
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?
mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и ti(x1) + ti(x2) + ti(x1, x2)может дать (немного) разные результаты. MWE …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


1
OLS vs. Poisson GLM с идентификационной связью
Мой вопрос показывает мое плохое понимание регрессии Пуассона и GLM в целом. Вот некоторые поддельные данные, чтобы проиллюстрировать мой вопрос: ### some fake data x=c(1:14) y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45) Некоторые пользовательские функции для возврата psuedo-R2: ### functions of pseudo-R2 psuR2 …

1
Как выбрать вероятность отсечения для редкого события Логистическая регрессия
У меня есть 100 000 наблюдений (9 фиктивных переменных индикатора) с 1000 положительных результатов. Логистическая регрессия должна работать нормально в этом случае, но вероятность отсечения озадачивает меня. В обычной литературе мы выбираем 50% -ное сокращение, чтобы предсказать 1 и 0. Я не могу этого сделать, так как моя модель дает …

1
Тест отношения правдоподобия и тест Вальда дают разные выводы для glm в R
Я воспроизводлю пример из обобщенных, линейных и смешанных моделей . Мой MWE ниже: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <- glm(formula=NoPositive/NoofPlates~log(Dilution), family=binomial("logit"), …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.