Вопросы с тегом «generalized-linear-model»

Обобщение линейной регрессии, учитывающее нелинейные отношения с помощью «функции связи» и дисперсии отклика, зависящей от прогнозируемого значения. (Не путать с «общей линейной моделью», которая расширяет обычную линейную модель до общей ковариационной структуры и многомерного отклика.)

2
Каково ожидаемое распределение остатков в обобщенной линейной модели?
Я выполняю обобщенную линейную модель, где я должен указать семью, отличную от нормальной. Каково ожидаемое распределение остатков? Например, должны ли остатки распределяться нормально?

2
Проблема со сравнением моделей GLM с другой функцией связи
Учитывая тот же набор ковариат и семейства распределений, как я могу сравнить модели, имеющие разные функции связи? Я думаю, что правильный ответ здесь - «AIC / BIC», но я не уверен на 100%. Можно ли иметь вложенные модели, если у них другая ссылка?

4
Как применить метод итеративно переоцененных наименьших квадратов (IRLS) к модели LASSO?
Я запрограммировал логистическую регрессию, используя алгоритм IRLS . Я хотел бы применить штраф LASSO для автоматического выбора правильных функций. На каждой итерации решается следующее: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Пусть λλ\lambda - неотрицательное действительное число. Я не наказываю перехват как предложено в Элементах. Статистическое обучение . То же самое для уже нулевых коэффициентов. …

2
Можно ли оценить GLM в Python / scikit-learn, используя распределения Пуассона, Гаммы или Твиди как семейство для распределения ошибок?
Пытаюсь выучить немного Python и Sklearn, но для своей работы мне нужно запустить регрессии, которые используют распределения ошибок из семейств Пуассона, Гаммы и особенно семейства Твиди. Я ничего не вижу в документации о них, но они есть в нескольких частях дистрибутива R, поэтому мне было интересно, видел ли кто-нибудь где-нибудь …

1
Манипулирование моделью логистической регрессии
Я хотел бы понять, что делает следующий код. Человек, который написал код, больше не работает здесь, и он почти полностью без документов. Меня попросили исследовать это кто-то, кто думает, что это "модель байесовской логистической регрессии " bglm <- function(Y,X) { # Y is a vector of binary responses # X …

4
Какие преимущества имеет пуассоновская регрессия по сравнению с линейной регрессией в этом случае?
Мне дали набор данных, который содержит количество наград, заработанных учащимися в одной средней школе, где предикторами количества полученных наград являются тип программы, в которую был зачислен учащийся, и балл по их итоговому экзамену по математике. Мне было интересно, может ли кто-нибудь сказать мне, почему модель линейной регрессии может быть непригодной …

1
подбор экспоненциальной функции с использованием метода наименьших квадратов в сравнении с обобщенной линейной моделью в сравнении с нелинейным методом наименьших квадратов
У меня есть набор данных, который представляет экспоненциальный спад. Я хотел бы приспособить экспоненциальную функцию к этим данным. Я попытался лог преобразовать переменную ответа и затем использовать наименьшие квадраты, чтобы соответствовать линии; использование обобщенной линейной модели с функцией логарифмической связи и гамма-распределением вокруг переменной отклика; и используя нелинейные наименьшие квадраты. …

1
Что такое «начальные значения» в функции glm ()?
Какие параметры start, etastart, mustartв GLM () функцию ? Я искал в документах и ​​Интернете, но я не нашел четкого объяснения, что это значит. Это похоже на байесовские «начальные значения» для цепочек, но я сомневаюсь, что это связано, так как функция glm () в R является статистикой частых ...

1
Расчет канонической функции связи в GLM
Я думал, что каноническая функция связи происходит от естественного параметра экспоненциального семейства. Скажем, рассмотрим семейство f ( y , θ , ψ ) = exp { y θ - b ( θ )г( ⋅ )g(⋅)g(\cdot) тогдаθ=θ(µ)- каноническая функция связи. Возьмемв качестве примера распределение Бернулли:P(Y=y)=μy(1-μ)1-y=exp{ylogμе( у, θ , ψ ) = …

1
Следует ли использовать поправки степеней свободы для определения параметров GLM?
Этот вопрос вдохновлен ответом Мартина здесь . Предположим, что мы подходим к GLM для однопараметрического семейства, такого как биномиальная модель или модель Пуассона, и что это процедура полного правдоподобия (в отличие от квазипуассона). Тогда дисперсия является функцией среднего значения. С биномом: и с Пуассоном .var[X]=E[X]E[1−X]var[X]=E[X]E[1−X]\text{var}[X] = E[X]E[1-X]var[X]=E[X]var[X]=E[X]\text{var}[X] = E[X] В …

3
Должен ли я использовать смещение для моего Poisson GLM?
Я провожу исследование, чтобы посмотреть на различия в плотности и богатстве видов рыб при использовании двух разных методов подводной визуальной переписи. Мои данные изначально были данными подсчета, но затем они обычно меняются на плотность рыбы, но я все же решил использовать Poisson GLM, что, я надеюсь, правильно. model1 <- glm(g_den …

1
Сколько дистрибутивов в GLM?
Я определил несколько мест в учебниках, где GLM описан с 5 распределениями (а именно: гамма, гауссовский, биномиальный, обратный гауссовский и пуассоновский). Это также иллюстрируется в функции семьи в R. Иногда я сталкиваюсь с ссылками на GLM, где включены дополнительные дистрибутивы ( пример ). Может кто-нибудь объяснить, почему эти 5 являются …

2
Байесовская модель логита - интуитивное объяснение?
Я должен признаться, что раньше я не слышал об этом термине ни в одном из моих классов, старшекурсников или выпускников. Что значит для логистической регрессии быть байесовским? Я ищу объяснение с переходом от обычной логистики к байесовской логистике, подобное следующему: Это уравнение в модели линейной регрессии: .E(y)=β0+β1x1+...+βnxnE(y)=β0+β1x1+...+βnxnE(y) = \beta_0 + …

1
Протестируйте модель GLM, используя нулевые и модельные отклонения
Я построил модель glm в R и протестировал ее с помощью группы тестирования и обучения, поэтому уверен, что она работает хорошо. Результаты от R: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -2.781e+00 1.677e-02 -165.789 < 2e-16 *** Coeff_A 1.663e-05 5.438e-06 3.059 0.00222 ** log(Coeff_B) 8.925e-01 1.023e-02 87.245 < 2e-16 …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.