Вопросы с тегом «generalized-linear-model»

Обобщение линейной регрессии, учитывающее нелинейные отношения с помощью «функции связи» и дисперсии отклика, зависящей от прогнозируемого значения. (Не путать с «общей линейной моделью», которая расширяет обычную линейную модель до общей ковариационной структуры и многомерного отклика.)

2
Семейство GLM представляет собой распределение переменной ответа или остатков?
Я обсуждал это с несколькими сотрудниками лаборатории, и мы обратились к нескольким источникам, но до сих пор не получили ответа: Когда мы говорим, что у GLM есть семейство пуассонов , скажем, мы говорим о распределении остатков или переменной отклика? Спорные вопросы Читая эту статью, она утверждает, что допущения GLM - …

1
Формат ввода ответа в биномиальном glm в R
В России Rсуществует три метода форматирования входных данных для логистической регрессии с использованием glmфункции: Данные могут быть в «двоичном» формате для каждого наблюдения (например, y = 0 или 1 для каждого наблюдения); Данные могут быть в формате «Уилкинсон-Роджерс» (например, y = cbind(success, failure)), где каждая строка представляет одну обработку; или …

1
Можете ли вы дать простое интуитивное объяснение метода IRLS, чтобы найти MLE GLM?
Фон: Я пытаюсь следовать обзору Принстона оценки MLE для GLM . Я понимаю основы оценки MLE: likelihood, score, наблюдаемая и ожидаемая Fisher informationи Fisher scoringтехника. И я знаю, как обосновать простую линейную регрессию с помощью оценки MLE . Вопрос: Я не могу понять даже первую строку этого метода :( Что …

4
Интерпретация случайного отклонения эффекта в блеске
Я пересматриваю статью о опылении, где данные распределены биномиально (плод созревает или нет). Поэтому я использовал glmerодин случайный эффект (отдельное растение) и один фиксированный эффект (обработка). Рецензент хочет знать, повлияло ли растение на плодоношение, но у меня проблемы с интерпретацией glmerрезультатов. Я читал в Интернете, и, кажется, могут быть проблемы …

1
Гамма GLM с логарифмической связью против гауссовой GLM с логарифмической связью против LM с логарифмическим преобразованием
Из моих результатов видно, что GLM Gamma отвечает большинству допущений, но стоит ли это значительного улучшения по сравнению с лог-преобразованным LM? Большая часть литературы, которую я нашел, посвящена пуассоновским или биномиальным GLM. Я нашел статью ОЦЕНКА ОБОБЩЕНИЙ ОБОБЩЕННОЙ ЛИНЕЙНОЙ МОДЕЛИ С ИСПОЛЬЗОВАНИЕМ Рандомизации очень полезной, но в ней отсутствуют реальные …

2
Понимание создания фиктивных (ручных или автоматических) переменных в GLM
Если в формуле glm используется факторная переменная (например, пол с уровнями M и F), то создаются фиктивные переменные, которые можно найти в сводке модели glm вместе с соответствующими коэффициентами (например, полM) Если вместо того, чтобы полагаться на R для разделения коэффициента таким образом, коэффициент кодируется в виде последовательности числовых переменных …

1
Для усреднения модели GLM, мы усредняем прогнозы по ссылке или шкале ответов?
Вычислить усредненные по модели прогнозы по шкале отклика GLM, которая является «правильной» и почему? Вычислить усредненный прогноз по шкале канала и затем преобразовать обратно в шкалу ответов, или Обратно преобразовать прогнозы в шкалу ответов, а затем вычислить среднее по модели Прогнозы близки, но не равны, если модель является GLM. Различные …

2
Сплайны в GLM и GAM
Неправильно ли, что сплайны доступны только в GAM-моделях, а не в GLM-моделях? Я слышал это некоторое время назад, и удивляюсь, является ли это просто заблуждением, или в этом есть доля правды. Вот иллюстрация:

2
Использование lm для 2-пробы
Некоторое время я использовал линейные модели для проведения тестов пропорции 2 образцов, но понял, что это может быть не совсем правильно. Похоже, что использование обобщенной линейной модели с биномиальной связью семейство + тождественность дает в точности результаты пула для 2-выборочной пропорции. Однако использование линейной модели (или glm с семейством гауссов) …

2
Ридж наказал GLM, используя увеличение строки?
Я читал, что регрессия гребня может быть достигнута простым добавлением строк данных в исходную матрицу данных, где каждая строка создается с использованием 0 для зависимых переменных и квадратного корня из Кkk или нуля для независимых переменных. Затем добавляется одна дополнительная строка для каждой независимой переменной. Мне было интересно, можно ли …

1
Сверхдисперсность и моделирование в пуассоновских моделях случайных эффектов со смещениями
Я столкнулся с рядом практических вопросов при моделировании данных подсчета из экспериментальных исследований с использованием эксперимента внутри объекта. Я кратко опишу эксперимент, данные и то, что я уже сделал, а затем мои вопросы. Четыре различных фильма были показаны выборке респондентов в последовательности. После каждого фильма проводилось интервью, в котором мы …

1
Логистическая регрессия со сплайнами регрессии в R
Я разрабатывал модель логистической регрессии на основе ретроспективных данных из национальной базы данных о травмах головы в Великобритании. Ключевым результатом является 30-дневная смертность (обозначается как «выживаемая» мера). Другие меры с опубликованным доказательством существенного влияния на результат в предыдущих исследованиях включают в себя: Year - Year of procedure = 1994-2013 Age …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Проверка невязок на нормальность в обобщенных линейных моделях
Эта статья использует обобщенные линейные модели (как биномиальное, так и отрицательное биномиальное распределение ошибок) для анализа данных. Но затем в разделе методов статистического анализа есть следующее утверждение: ... и, во-вторых, путем моделирования данных присутствия с использованием моделей логистической регрессии и данных о времени нагула с использованием обобщенной линейной модели (GLM). …

1
Есть ли проблема с мультиколлинеарностью и регрессией сплайнов?
При использовании естественных (то есть ограниченных) кубических сплайнов созданные базовые функции являются в высокой степени коллинеарными, и при использовании в регрессии, по-видимому, они дают очень высокую статистику VIF (дисперсионный коэффициент инфляции), сигнализируя о мультиколлинеарности. Когда кто-то рассматривает случай модели для целей прогнозирования, это проблема? Кажется, что так будет всегда из-за …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.