Ниже приведена пара очень простых моделей. Они оба имеют недостатки, по крайней мере, одним способом, но, возможно, они предоставят что-то, на чем можно было бы основываться. Вторая модель на самом деле не (вполне) учитывает сценарий ОП (см. Примечания ниже), но я оставляю его на случай, если он каким-то образом поможет.
Модель 1 : вариант модели Брэдли – Терри
Предположим, что мы в первую очередь заинтересованы в том, чтобы предсказать, победит ли одна команда другую, основываясь на игроках в каждой команде. Мы можем просто записать, побеждает ли команда 1 с игроками (i,j) команду 2 с игроками (k,ℓ) в каждой игре, игнорируя итоговый счет. Конечно, это выбрасывает некоторую информацию, но во многих случаях это все еще предоставляет много информации.
Модель , то
l o g i t ( P (команда 1 побеждает команду 2))= αя+ αJ- αК- αℓ,
То есть у нас есть параметр «сродства» для каждого игрока, который влияет на то, насколько этот игрок повышает шансы на победу своей команды. Определите «силу» игрока по . Затем эта модель утверждает, что
P ( команда 1 побеждает команду 2 ) = s i s jsя= еαя
P (команда 1 побеждает команду 2)= sяsJsяsJ+ сКsℓ,
Здесь очень хорошая симметрия в том, что не имеет значения, как кодируется ответ, если он согласуется с предикторами. То есть мы также имеем
l o g i t ( P (команда 2 побеждает команду 1))= αК+ αℓ- αя- αJ,
Это может быть легко приспособлено как логистическая регрессия с предикторами, которые являются индикаторами (по одному на каждого игрока), принимающими значение если игрок i входит в Команду 1 для рассматриваемой игры, - 1, если она в Команде 2, и 0, если она не участвовать в этой игре.+ 1я- 10
Отсюда и естественный рейтинг игроков. Чем больше ( s ), тем больше игрок повышает шанс своей команды на победу. Таким образом, мы можем просто ранжировать игроков в соответствии с их оценочными коэффициентами. (Обратите внимание, что параметры сродства можно идентифицировать только с общим смещением. Поэтому обычно фиксируют α 1 = 0, чтобы сделать модель идентифицируемой.)αsα1= 0
Модель 2 : Независимая оценка
NB . После перечитывания вопроса ОП становится очевидным, что приведенные ниже модели не подходят для его настройки. В частности, ОП заинтересована в игре, которая заканчивается после того, как одна или другая команда набрали фиксированное количество очков. Приведенные ниже модели больше подходят для игр, которые имеют фиксированную продолжительность во времени. Модификации могут быть сделаны так, чтобы лучше соответствовать структуре ОП, но для их разработки потребуется отдельный ответ.
Теперь мы хотим отслеживать результаты. Предположим, что это разумное приближение, что каждая команда набирает очки независимо друг от друга с количеством очков, набранных в любом интервале, не зависящем от любого непересекающегося интервала. Затем количество очков, которое набирает каждая команда, можно смоделировать как случайную переменную Пуассона.
яJ
журнал(μ)=γi+γj
Обратите внимание, что эта модель игнорирует фактические совпадения между командами, ориентируясь исключительно на выигрыш.
σi=eγя( Я , Дж )( к , ℓ )
P (команда 1 побеждает команду 2 в случае внезапной смерти)= σяσJσяσJ+ σКσℓ,
ρяδя( я , j )( к , ℓ )
log(μ1)=ρi+ρj−δk−δℓ
log(μ2) =ρК+ ρℓ- δя- δJ
В этой модели подсчет очков по-прежнему независим, но теперь между игроками в каждой команде происходит взаимодействие, которое влияет на счет. Игроки могут также быть оценены согласно их оценкам коэффициента сродства.
Модель 2 (и ее варианты) также позволяет прогнозировать окончательный результат.
Расширения . Одним из полезных способов расширения обеих моделей является включение порядка, в котором положительные показатели соответствуют «домашней» команде, а отрицательные показатели - «выездной» команде. Добавление термина «перехват» к моделям может быть интерпретировано как «преимущество домашнего поля». Другие расширения могут включать включение вероятности связей в Модель 1 (на самом деле это уже возможно в Модели 2).
Примечание : по крайней мере, один из компьютеризированных опросов ( Peter Wolfe's ), используемых для серии чемпионатов по боулингу в американском футболе среди колледжей, использует (стандартную) модель Брэдли – Терри для составления своего рейтинга.