Приведенные выше ответы более интуитивны, поэтому я стараюсь быть более строгими.
Что такое GLM?
Пусть обозначает набор ответа и мерного ковариатного вектора с ожидаемым значением . Для независимых наблюдений распределение каждого представляет собой экспоненциальное семейство с плотностью
Здесь интересующий параметр (естественный или канонический параметр) равен , - параметр масштаба (известный или воспринимаемый как неприятность), а и - известные функции. Y=(y,x)ypx=(x1,…,xp)E(y)=μi=1,…,nyi
f(yi;θi,ϕ)=exp{[yiθi−γ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnвекторы фиксированных входных значений для объясняющих переменных обозначаются через . Мы предполагаем, что входные векторы влияют на (1) только через линейную функцию, линейный предиктор,
от которого зависит . Как можно показать, что , эта зависимость устанавливается путем соединения линейного предиктора и через среднее значение. Более конкретно, среднее рассматривается как обратимая и гладкая функция линейного предиктора, т.е.
px1,…,xpηi=β0+β1xi1+⋯+βpxip
θiθ=(γ′)−1(μ)ηθμg(μ)=η or μ=g−1(η)
Теперь, чтобы ответить на ваш вопрос:
Функция называется функцией связи. Если функция соединяет , и , что , то эта ссылка называется канонической и имеет вид .g(⋅)μηθη≡θg=(γ′)−1
Вот и все. Тогда есть ряд желательных статистических свойств использования канонической ссылки, например, достаточной статистикой является с компонентами для , метод Ньютона и оценка Фишера для обнаружив, что оценщик ML совпадают, эти ссылки упрощают вывод MLE, они гарантируют, что некоторые свойства линейной регрессии (например, сумма остатков равна 0), сохраняются или они гарантируют, что остается в диапазоне выходной переменной ,X′y∑ixijyij=1,…,pμ
Следовательно, они, как правило, используются по умолчанию. Однако обратите внимание, что нет априорной причины, по которой эффекты в модели должны быть аддитивными в масштабе, указанном этой или любой другой ссылкой.