Расчет согласованности стрельбы NBA


10

Каков будет правильный способ оценить / определить последовательность стрельбы игрока NBA в 3 очка? Например, у меня есть игрок, который стреляет 37% с 3-х точек и делает 200 попыток в течение всего года.

Я подумывал о том, чтобы взять скользящее среднее значение 3% от произвольного количества снимков (скажем, 20). Затем, используя эти средние значения, определите стандартное отклонение от среднего значения 37%. Использование скользящей выборки размером в 20 снимков позволяет с точностью до 5% в процентах снимков, но я обеспокоен тем, что использование слишком большого количества снимков не выявит несоответствия в производительности.

Есть ли лучший подход для определения согласованности?


Для чего вы собираетесь использовать это измерение? Например, вы хотите сравнить игроков друг с другом? Вы просто хотите увидеть, кто самый последовательный? Или у вас есть более конкретный вопрос, например, что последовательность выше, когда ваша команда впереди, или что-то в этом роде?
Питер Флом

Я использую измерение, чтобы определить, насколько последовательным является каждый трехочковый стрелок в команде (игроков, у которых есть минимальное количество попыток). Я хочу сравнить согласованность между игроками, понимая, что в сезоне у них будет неодинаковое количество попыток.
Будет ли

Я думаю, что ваша основная идея хороша. Но почему скользящее среднее? Почему не "первые 10 выстрелов", "11-20" и т. Д.? Вы можете попробовать разные количества снимков. Вы также должны, вероятно, ограничить это игроками, по крайней мере, с определенным минимальным количеством выстрелов в сезоне
Питер Флом

1
Я думаю, что, взяв данные кусками вместо скользящего среднего, я могу пропустить периоды непоследовательной съемки. Крайний пример: игрок делает броски 1-5, пропускает выстрелы 6-15 и делает броски 16-20. Использование группировок по 10 выстрелов приводит к двум 50% группам стрельбы, но скользящее среднее из 10 выстрелов показывает 0% спад стрельбы.
Будет ли

1
Сделайте анализ прогонов . Кроме того, вам нужно четко понимать, что вы имеете в виду, когда говорите «непротиворечивый» - я собираюсь интерпретировать это как означающее, что вероятность выполнения выстрела постоянна для каждого отдельного выстрела (т.е. она полностью не зависит от любые и все предыдущие результаты). Согласен? Тем не менее, do an analysis of runs...
Стив С

Ответы:


1

Как сказал другой пользователь в комментариях выше, пробный тест - это способ анализа ваших съемочных данных. Это проверяет гипотезу, что элементы последовательности являются взаимно независимыми. Если гипотеза отвергнута, вы можете сказать, что стрельба игрока по 3 точкам противоречива.

Я также хотел бы указать вам на эту статью, поскольку она напрямую связана с вашим анализом.


Хорошо включить ссылки, но еще лучше объяснить, что они содержат.
rolando2

1

Я думаю, что пробный тест - это хорошая идея. Для меня, анализируя данные в «чанках», вы намереваетесь создать прокси или контролировать «горячие руки» в согласованности игроков. Существует огромное количество литературы по этому явлению. Одна из лучших статей была обсуждена Гельманом в его блоге в июле 2015 года. Заголовок его сообщения был: «Эй, угадай, что? Там действительно горячая рука!» ( http://andrewgelman.com/2015/07/09/hey-guess-what-there-really-is-a-hot-hand/ ). Документ, о котором сообщает Гельман, является опровержением большей части предыдущей литературы, поскольку в нем подробно описываются ошибки, допущенные в результате предыдущего анализа феномена горячих рук. Предыдущая работа была сосредоточена на общем, а не на условных вероятностях. Эта статья представляет новую последовательную вероятностную модель (см. Ссылку для ссылки).

Один хороший показатель согласованности, который должен контролировать различия, например, в количестве сделанных снимков, - это коэффициент вариации. CV представляет собой безразмерную масштабно-инвариантную меру изменчивости и рассчитывается путем деления стандартного отклонения на среднее. Проблема, которую он пытается решить, состоит в том, что стандартные отклонения выражаются в шкале измеряемой единицы, т. Е. Она не является инвариантной. Это означает, что метрики с высокими средними значениями также будут иметь более высокие отклонения стандартного отклонения, чем метрики с низкими средними значениями. Так, например, из-за различий в их средних значениях показатели изменчивости диастолического и систолического артериального давления не могут быть напрямую сопоставлены. Принимая CV, их изменчивость становится сопоставимой. То же самое относится ко многим другим показателям, таким как цены на акции,

Таким образом, CV можно рассчитать для многих метрик и типов шкал, исключая категориальную информацию и показатели с отрицательными значениями.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.