Резюме
Я делюсь своими мыслями в разделе « Детали ». Я думаю, что они полезны для определения того, чего мы действительно хотим достичь.
Я думаю, что главная проблема здесь в том, что вы не определили, что означает сходство рангов. Поэтому никто не знает, какой метод измерения разницы между рангами лучше.
По сути, это оставляет нам неоднозначно выбирать метод, основанный на догадках.
Что я действительно предлагаю, так это сначала определить цель математической оптимизации. Только тогда мы будем уверены, действительно ли мы знаем, чего хотим.
Если мы этого не сделаем, на самом деле не знаю, чего мы хотим. Мы могли бы почти знать , что мы хотим, но почти зная знать .≠
Мой текст в деталях по сути является шагом к достижению математического определения сходства рангов . Как только мы это сделаем, мы сможем уверенно двигаться вперед, чтобы выбрать лучший метод измерения подобия.
Детали
Основано на одном из ваших комментариев:
- « Цель состоит в том, чтобы увидеть, различаются ли рейтинги двух групп », Питер Флом.
Чтобы ответить на это, строго интерпретируя цель:
- Ранги различаются, если для любого элемента существует такой i , что a i ≠ b i , где a i - ранг элемента i группы a, а b i - ранг того же пункта, но по группе б .i∈{1,2,…,25}iai≠biaiiabib
- Иначе, ряды не отличаются.
Но я не думаю, что вы действительно хотите эту строгую интерпретацию. Поэтому я думаю, что вы действительно хотели сказать:
- Насколько отличаются ранги групп и б ?ab
Одно из решений здесь - просто измерить минимальное расстояние редактирования . Т.е. каково минимальное количество правок, которые необходимо выполнить в ранжированном списке группы , чтобы оно стало идентичным таковому для группы b .ab
Редактирование может быть определено как замена двух элементов, а стоимость стоит пунктов в зависимости от того, сколько прыжков необходимо. Таким образом, если элемент 1 необходимо поменять местами с пунктом 3 (чтобы получить идентичные ранги между группами из групп a и b ), тогда стоимость этого редактирования составляет 3 .n13ab3
Но подходит ли этот метод? Чтобы ответить на это, давайте посмотрим на это немного глубже:
a,b3c,d123a,bc,dc,d
Предполагается, что стоимость каждого редактирования является линейной по отношению к количеству прыжков. Это правда для нашего домена приложения? Может ли быть так, что логистические отношения более подходят? Или экспоненциальный ?
15
После того, как мы рассмотрим вышеприведенные пункты и достигнем подходящего показателя сходства между двумя рангами, нам нужно будет задать более интересные вопросы, такие как:
the best ways to compare these rankings
- то , что тип разницы м.т. 2 групп , которые Вы хотели бы знать?