У меня похожая проблема с вопросом, заданным здесь:
Как измерить неоднородность распределения?
У меня есть набор распределения вероятностей по дням недели. Я хочу измерить, насколько близко каждое распределение к (1 / 7,1 / 7, ..., 1/7).
В данный момент я использую ответ на вышеуказанный вопрос; норма L2, которая имеет значение 1, когда распределение имеет массу 1 для одного из дней, и минимизируется для (1 / 7,1 / 7, ..., 1/7). Я линейно масштабирую это, чтобы оно лежало между 0 и 1, затем переворачиваю его так, что 0 означает совершенно неоднородный, а 1 означает совершенно однородный.
Это работает довольно хорошо, но у меня есть одна проблема с этим; каждый день недели одинаково рассматривается как измерение в 7-мерном пространстве, поэтому он не учитывает близость дней; другими словами, он дает одинаковую оценку (1 / 2,1 / 2,0,0,0,0,0) и (1 / 2,0,0,1 / 2,0,0,0) даже хотя в некотором смысле последний более «разложен» и однороден, и в идеале должен получить более высокий балл. Очевидно, есть дополнительное осложнение, что порядок дней является циклическим.
Как я могу изменить эту эвристику, чтобы учесть близость дней?