В чем разница между «функцией связи» и «канонической функцией связи» для GLM


65

В чем разница между терминами «функция связи» и «функция канонического соединения»? Кроме того, есть ли (теоретические) преимущества использования одного над другим?

Например, двоичная переменная ответа может быть смоделирована с использованием многих функций связи, таких как logit , probit и т. Д. Но логит здесь считается «канонической» функцией связи.


10
Здесь я подробно обсуждаю функции линковки: Разница между логит-моделями и пробит-моделями , уделяя особое внимание регрессии для бинарной переменной ответа. Хотя лишь небольшая часть этого обсуждения фокусируется на значении «канонической» функции ссылки, тем не менее она может быть полезна для чтения. Обратите внимание, что для понимания различий между преимуществами канонической и неканонической функций связи достаточно углубиться в математику, лежащую в основе GLiM.
gung - Восстановить Монику

Ответы:


68

Приведенные выше ответы более интуитивны, поэтому я стараюсь быть более строгими.

Что такое GLM?

Пусть обозначает набор ответа и мерного ковариатного вектора с ожидаемым значением . Для независимых наблюдений распределение каждого представляет собой экспоненциальное семейство с плотностью Здесь интересующий параметр (естественный или канонический параметр) равен , - параметр масштаба (известный или воспринимаемый как неприятность), а и - известные функции. Y=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyi

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnвекторы фиксированных входных значений для объясняющих переменных обозначаются через . Мы предполагаем, что входные векторы влияют на (1) только через линейную функцию, линейный предиктор, от которого зависит . Как можно показать, что , эта зависимость устанавливается путем соединения линейного предиктора и через среднее значение. Более конкретно, среднее рассматривается как обратимая и гладкая функция линейного предиктора, т.е. px1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ)ηθμ
g(μ)=η or μ=g1(η)
Теперь, чтобы ответить на ваш вопрос:

Функция называется функцией связи. Если функция соединяет , и , что , то эта ссылка называется канонической и имеет вид .g()μηθηθg=(γ)1

Вот и все. Тогда есть ряд желательных статистических свойств использования канонической ссылки, например, достаточной статистикой является с компонентами для , метод Ньютона и оценка Фишера для обнаружив, что оценщик ML совпадают, эти ссылки упрощают вывод MLE, они гарантируют, что некоторые свойства линейной регрессии (например, сумма остатков равна 0), сохраняются или они гарантируют, что остается в диапазоне выходной переменной ,Xyixijyij=1,,pμ

Следовательно, они, как правило, используются по умолчанию. Однако обратите внимание, что нет априорной причины, по которой эффекты в модели должны быть аддитивными в масштабе, указанном этой или любой другой ссылкой.


5
+1, это действительно хороший ответ, @Momo. Мне было труднее читать некоторые уравнения, когда они были похоронены в абзацах, поэтому я «заблокировал» их, используя двойные знаки доллара (то есть $ $). Я надеюсь, что все в порядке (если нет, вы можете откат, с моими извинениями).
gung - Восстановить Монику

1
@Momo, оригинальный вопрос здесь, однако, включает в себя то, о чем спрашивал Вей, так что стоит отметить, что на него пока нет четкого ответа.
Glen_b

1
Надеюсь, я правильно понимаю вашу путаницу: в экспоненциальной семье, о которой вы говорите, канонический параметр - это а каноническая ссылка - когда есть когда . Как и (если вычислить ожидаемое значение первой производной по функции правдоподобия), единственный случай, когда появляется, когда . θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)
Momo

1
Большое спасибо. Используя предыдущий пример, мы имеем это . Следовательно . Как вы сказали (я просто перефразирую), у нас есть если - каноническая ссылка, то есть logit. Тогда у нас будет . Таким образом, равенство между и предиктором существует, только если мы используем функцию канонического связывания. γ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθη
Druss2k

2
Кажется, что в ключевом предложении ответа есть опечатка: не следует ли прочитать «если функция соединяет и st »? μθηθ
Лев Алексеев

16

Гунг привел хорошее объяснение: каноническая ссылка обладает особыми теоретическими свойствами минимальной достаточности. Это означает, что вы можете определить условную логит-модель (которую экономисты называют моделью с фиксированным эффектом), обусловливая количество результатов, но вы не можете определить условную пробитную модель, потому что нет достаточной статистики для использования с пробитной связью.


Можете ли вы рассказать немного о минимальной достаточности? По приведенному выше объяснению мы все еще можем определить модель пробита, верно? Это точно не будет функция канонической ссылки, но какой вред использование неканонической функции ссылки.
pikachuchameleon

9

Вот небольшая диаграмма, вдохновленная классом MIT 18.650, который я считаю весьма полезным, поскольку он помогает визуализировать отношения между этими функциями. Я использовал ту же запись, что и в посте @ momo:

введите описание изображения здесь

  • γ(θ) - функция, создающая кумулянтный момент
  • g(μ) - функция связи

Таким образом, функция связи связывает линейный предиктор со средним значением и должна быть монотонно возрастающей, непрерывно дифференцируемой и обратимой.g

Диаграмма позволяет легко переходить из одного направления в другое, например:

η=g(γ(θ))
θ=γ1(g1(η))

Каноническая функция связи

Другой способ понять, что Момо строго описал, состоит в том, что, когда - каноническая функция связи, то композиция композиции это тождество и поэтому мы получаем g

γ1g1=(gγ)1=I
θ=η

1

Ответы выше уже охватили то, что я хочу сказать. Просто чтобы прояснить несколько моментов как исследователь машинного обучения:

  1. Функция Link является ничем иным, как обратной функцией активации. Например, logit - это обратная сигмоида, а probit - обратная кумулятивная функция распределения Гаусса.

  2. Если мы возьмем параметр обобщенной линейной модели только в зависимости от , где является вектором веса, а является входным параметром, то функция связи называется канонической.wTxwx

Вышеприведенное обсуждение не имеет ничего общего с экспоненциальным семейством, но хорошее обсуждение можно найти в PRML-книге Кристофера Бишопа, глава 4.3.6.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.