Использовать ли смещение в регрессии Пуассона при прогнозировании общих карьерных целей, забитых хоккеистами


10

У меня вопрос по поводу того, стоит ли использовать смещение. Предположим, очень простая модель, где вы хотите описать (общее) количество голов в хоккее. Таким образом, у вас есть цели, количество сыгранных игр и фиктивная переменная «нападающий», которая равна 1, если игрок является нападающим, и 0 в противном случае. Итак, какая из следующих моделей правильно указана?

  1. цели = игры + нападающий или

  2. Цели = офсетные (игры) + нападающий

Опять же, цели - это общие цели, а количество игр - это общие игры для одного игрока. Например, может быть выбран игрок, у которого 50 голов в 100 играх, и другой игрок, у которого 20 голов в 50 играх и так далее.

Что я должен делать, когда хочу оценить количество голов? Действительно ли здесь необходимо использовать смещение?

Ссылки:


Какова ваша зависимая переменная? Это общее количество голов в карьере на сегодняшний день для конкретного игрока? Кроме того, есть ли причина, по которой вы не хотите прогнозировать средние цели за игру?
Джером Энглим

Да, это общее количество голов! Нет, у меня нет данных для каждой игры. У меня просто есть общие данные.
MarkDollar

Зависимой переменной является (количество) целей. (Смотрите уравнения выше)
MarkDollar

Я немного подправил заголовок, чтобы он не дублировал предыдущий вопрос. Не стесняйтесь изменять, если я неправильно истолковал.
Джером Энглим

Ответы:


16

Офсетная модель моделирует цели для игры, как можно увидеть здесь:

log(goals/games) = a+bx

эквивалентно

log(goals) -log(games) = a+bx

эквивалентно

log(goals)= a+bx +log(games)   <-this is an offset model, assumes coef on the last term =1

Слайд 35 здесь: http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf

Если вы думаете, что + bx относится к логарифму количества голов к играм (коэффициент), используйте смещение. Если вы думаете, что есть более сложный игровой эффект, возможно, от накопления опыта, не делайте этого. Для получения дополнительной информации см. Это: http://ezinearticles.com/?The-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811.


1

Несколько простых моментов, не относящихся непосредственно к вашему вопросу о смещениях:

  • Я бы посмотрел, соотносится ли количество игр со средними забитыми мячами. Во многих элитных видах спорта, в которых я забиваю голы (например, футбол, австралийский футбол и т. Д.), Я бы предсказал, что долговечность карьеры связана с успехом карьеры. И, по крайней мере, для игроков, выполняющих роли, забивающие голы, успех связан с количеством забитых голов. Если это правда, то количество игр будет захватывать два эффекта. Можно было бы сказать, что чем больше игр, тем больше возможностей забивать голы; а другой будет отражать эффекты, связанные с навыками. Вы можете изучить соотношение между количеством игр и средними забитыми мячами (например, количество голов / количество игр), чтобы изучить это. Я думаю, что это имеет существенное значение для любого моделирования, которое вы делаете.
  • Мои инстинкты - конвертировать зависимую переменную в средние цели за игру. Я понимаю, что у вас будет более точное измерение навыка игрока для тех, кто играет больше игр, так что, возможно, это будет проблемой. В зависимости от точности вашей модели, которую вы хотите, и результирующего распределения игроков, вы можете рассчитывать на стандартные методы линейного моделирования. Но, возможно, это слишком применимо для ваших целей, и, возможно, у вас есть причины желать смоделировать общее количество забитых голов.

Привет, Джером! То, что вы описали, абсолютно правильно. Но нет способа создать модель, которая измеряет цели / игры. Поэтому я вынужден использовать модель выше (цели как зависимые и игры как независимые переменные). Я знаю, что игры связаны с такими вещами, как умение, и что я должен исследовать эту проблему (проблема с пропущенными переменными и эндогенность). Но сейчас мне интересно, какую из двух моделей выше использовать!
MarkDollar
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.