Вопросы с тегом «generalized-linear-model»

Обобщение линейной регрессии, учитывающее нелинейные отношения с помощью «функции связи» и дисперсии отклика, зависящей от прогнозируемого значения. (Не путать с «общей линейной моделью», которая расширяет обычную линейную модель до общей ковариационной структуры и многомерного отклика.)

2
Почему мы суетимся из-за использования очков Фишера, когда ставим GLM?
Мне любопытно, почему мы относимся к подгонке GLMS, как к какой-то особой проблеме оптимизации. Они? Мне кажется, что это просто максимальная вероятность, и мы записываем вероятность, а затем ... мы максимизируем ее! Так почему же мы используем оценку Фишера вместо множества схем оптимизации, разработанных в прикладной математической литературе?

2
Почему GLM отличается от LM с преобразованной переменной
Как поясняется в раздаточном материале этого курса (стр. 1) , линейная модель может быть записана в виде: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, где - переменная ответа, а - пояснительная переменная .yyyxixix_{i}ithithi^{th} Часто с целью удовлетворения предположений теста можно преобразовать переменную ответа. Например, мы …

1
Имеет ли логарифмическая вероятность в GLM гарантированную сходимость к глобальным максимумам?
Мои вопросы: Обязательно ли обобщенные линейные модели (GLM) сходятся к глобальному максимуму? Если так, то почему? Кроме того, какие ограничения существуют для функции связи для обеспечения выпуклости? Мое понимание GLM состоит в том, что они максимизируют крайне нелинейную функцию правдоподобия. Таким образом, я бы предположил, что существует несколько локальных максимумов, …

4
Какая лучшая книга об обобщенных линейных моделях для новичков?
Я все еще довольно новичок в обобщенных линейных моделях, и я борюсь со многими обозначениями в большинстве текстов GLM, которые я выбрал. Существуют ли чрезвычайно популярные книги по GLM, которые лучше читаются?

3
Как бы вы объяснили обобщенные линейные модели людям без статистического фона?
Мне всегда трудно объяснить статистические методы аудитории без статистического фона. Если бы я хотел объяснить, что такое GLM для такой аудитории (не выбрасывая статистический жаргон), что было бы лучшим или наиболее эффективным способом? Я обычно объясняю GLM тремя частями - (1) случайный компонент, который является переменной отклика, (2) систематический компонент, …

2
Являются ли тесты на избыточную дисперсию в GLM действительно * полезными *?
Феномен «чрезмерной дисперсии» в GLM возникает всякий раз, когда мы используем модель, которая ограничивает дисперсию переменной отклика, и данные демонстрируют большую дисперсию, чем позволяет ограничение модели. Это обычно происходит при моделировании данных подсчета с использованием Poisson GLM, и это можно диагностировать с помощью хорошо известных тестов. Если тесты показывают, что …

3
Использование glm () вместо простого теста хи-квадрат
Я заинтересован в изменении нулевых гипотез, используя glm()в R. Например: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) проверяет гипотезу, что . Что если я захочу изменить значение null на = какое-то произвольное значение внутри ? рр = 0,5пзнак равно0,5p = 0.5ппpglm() Я знаю, что это можно …

4
Точность градиентной машины уменьшается с увеличением числа итераций
Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
Определение ковариационной структуры: плюсы и минусы
Каковы преимущества указания ковариационной структуры в GLM (вместо того, чтобы рассматривать все недиагональные элементы в ковариационной матрице как ноль)? Помимо отражения того, что каждый знает о данных, делает это улучшить качество посадки? повысить точность прогнозирования на удерживаемых данных? Позвольте нам оценить степень ковариации? Каковы затраты на навязывание ковариационной структуры? Является …

3
Может ли модель для неотрицательных данных со сгущением в нули (Tweedie GLM, нулевое раздувание GLM и т. Д.) Предсказать точные нули?
Распределение Твиди может моделировать искаженные данные с точечной массой в нуле, когда параметр (показатель степени в отношении средней дисперсии) находится между 1 и 2.pпp Точно так же модель с нулевой раздувкой (будь то непрерывная или дискретная) может иметь большое количество нулей. У меня возникают проблемы с пониманием, почему, когда я …

3
Когда использовать GAM против GLM
Я понимаю, что это может быть потенциально широкий вопрос, но мне было интересно, существуют ли обобщенные предположения, которые указывают на использование GAM (Обобщенная аддитивная модель) над GLM (Обобщенная линейная модель)? Кто-то недавно сказал мне, что GAM следует использовать только тогда, когда я предполагаю, что структура данных является «аддитивной», то есть …

2
Почему линейная регрессия имеет допущение об остаточной, а обобщенная линейная модель имеет допущения об отклике?
Почему линейная регрессия и обобщенная модель имеют противоречивые предположения? В линейной регрессии мы предполагаем, что остаток происходит от гауссовой В другой регрессии (логистическая регрессия, регрессия яда) мы предполагаем, что ответ приходит из некоторого распределения (биномиальное, отравление и т. Д.). Почему иногда предполагают остаточное, а другое время предполагают на ответ? Это …

1
Как случайные эффекты только с одним наблюдением повлияют на обобщенную линейную смешанную модель?
У меня есть набор данных, в котором переменная, которую я хотел бы использовать в качестве случайного эффекта, имеет только одно наблюдение для некоторых уровней. Основываясь на ответах на предыдущие вопросы, я понял, что в принципе это может быть хорошо. Могу ли я установить смешанную модель с объектами, которые имеют только …

2
GLM: проверка выбора распределения и функции связи
У меня есть обобщенная линейная модель, которая использует гауссово распределение и функцию логарифмической связи. После подгонки модели я проверяю невязки: график QQ, невязки против прогнозируемых значений, гистограмма невязок (признавая, что необходима должная осторожность). Все выглядит хорошо. Мне кажется, это говорит о том, что выбор гауссовского распределения был вполне разумным. Или, …

6
Время, проведенное в деятельности в качестве независимой переменной
Я хочу включить время, потраченное на выполнение чего-либо (например, недели грудного вскармливания), в качестве независимой переменной в линейную модель. Тем не менее, некоторые наблюдения не участвуют в поведении вообще. Кодировать их как 0 на самом деле неправильно, потому что 0 качественно отличается от любого значения> 0 (т.е. женщины, которые не …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.