Я надеюсь, что смогу правильно задать этот вопрос. У меня есть доступ к данным play-by-play, так что это скорее проблема с лучшим подходом и правильным построением данных.
Я рассчитываю рассчитать вероятность выигрыша в игре в НХЛ, учитывая количество очков и оставшееся время в регламенте. Я полагаю, что мог бы использовать логистическую регрессию, но я не уверен, как должен выглядеть набор данных. Буду ли я иметь несколько наблюдений за игру и за каждый интересующий меня отрезок времени? Буду ли я иметь одно наблюдение за игру и подгонять отдельные модели за отрезок времени? Логистическая регрессия - даже правильный путь?
Буду очень признателен за любую помощь, которую вы можете оказать!
С наилучшими пожеланиями.