Я думаю, что пробный тест - это хорошая идея. Для меня, анализируя данные в «чанках», вы намереваетесь создать прокси или контролировать «горячие руки» в согласованности игроков. Существует огромное количество литературы по этому явлению. Одна из лучших статей была обсуждена Гельманом в его блоге в июле 2015 года. Заголовок его сообщения был: «Эй, угадай, что? Там действительно горячая рука!» ( http://andrewgelman.com/2015/07/09/hey-guess-what-there-really-is-a-hot-hand/ ). Документ, о котором сообщает Гельман, является опровержением большей части предыдущей литературы, поскольку в нем подробно описываются ошибки, допущенные в результате предыдущего анализа феномена горячих рук. Предыдущая работа была сосредоточена на общем, а не на условных вероятностях. Эта статья представляет новую последовательную вероятностную модель (см. Ссылку для ссылки).
Один хороший показатель согласованности, который должен контролировать различия, например, в количестве сделанных снимков, - это коэффициент вариации. CV представляет собой безразмерную масштабно-инвариантную меру изменчивости и рассчитывается путем деления стандартного отклонения на среднее. Проблема, которую он пытается решить, состоит в том, что стандартные отклонения выражаются в шкале измеряемой единицы, т. Е. Она не является инвариантной. Это означает, что метрики с высокими средними значениями также будут иметь более высокие отклонения стандартного отклонения, чем метрики с низкими средними значениями. Так, например, из-за различий в их средних значениях показатели изменчивости диастолического и систолического артериального давления не могут быть напрямую сопоставлены. Принимая CV, их изменчивость становится сопоставимой. То же самое относится ко многим другим показателям, таким как цены на акции,
Таким образом, CV можно рассчитать для многих метрик и типов шкал, исключая категориальную информацию и показатели с отрицательными значениями.