У меня есть нейронная сеть, настроенная для предсказания чего-то, где выходная переменная является порядковой. Я опишу ниже, используя три возможных выхода A <B <C.
Совершенно очевидно, как использовать нейронную сеть для вывода категориальных данных: выходные данные - это просто максимальное значение последнего (обычно полностью подключенного) слоя, по одному на категорию, а прогнозируемая категория - та, которая имеет наибольшее выходное значение (это по умолчанию во многих популярных моделях). Я использовал ту же настройку для порядковых значений. Однако в этом случае выходы часто не имеют смысла, например, сетевые выходы для A и C высоки, а B низки: это невозможно для порядковых значений.
У меня есть одна идея для этого, которая заключается в том, чтобы рассчитать потери на основе сравнения выходных данных с 1 0 0 для A, 1 1 0 для B и 1 1 1 для C. Точные пороговые значения можно настроить позже, используя другой классификатор (например, байесовский ) но это, кажется, отражает основную идею упорядочения входных данных без указания какой-либо конкретной шкалы интервалов.
Каков стандартный способ решения этой проблемы? Есть ли какие-либо исследования или ссылки, которые описывают плюсы и минусы различных подходов?