В чем разница между функцией потерь и функцией принятия решений?


23

Я вижу, что обе функции являются частью методов интеллектуального анализа данных, таких как Gradient Boosting Regressors. Я вижу, что это тоже отдельные объекты.

Каковы отношения между обоими в целом?

Ответы:


45

Функция принятия решения - это функция, которая принимает набор данных в качестве входных данных и выдает решение в качестве выходных данных. Какое решение может быть, зависит от имеющейся проблемы. Примеры включают в себя:

  • Проблемы оценки: «решение» - это оценка.
  • Проблемы проверки гипотез: решение состоит в том, чтобы отклонить или не отклонить нулевую гипотезу.
  • Проблемы классификации: решение состоит в том, чтобы классифицировать новое наблюдение (или наблюдения) в категорию.
  • Проблемы выбора модели: решение состоит в том, чтобы выбрать одну из моделей-кандидатов.

Как правило, существует бесконечное количество функций решения, доступных для проблемы. Если, например, мы заинтересованы в оценке роста шведских мужчин на основе десяти наблюдений , мы можем использовать любую из следующих решающих функций d ( x ) :x=(x1,x2,,x10)d(x)

  • Выборка означает: .d(x)=110i=110xi
  • Медиана выборки: d(x)=median(x)
  • Среднее геометрическое для выборки: d(x)=x1x1010
  • Функция, которая всегда возвращает 1: , независимо от значения x . Глупо, да, но, тем не менее, это действительная функция принятия решения.d(x)=1x

Как тогда мы можем определить, какую из этих функций принятия решений использовать? Одним из способов является использование функции потерь , которая описывает потери (или затраты), связанные со всеми возможными решениями. Различные функции принятия решений будут приводить к ошибкам разных типов. Функция потерь говорит нам, к какому типу ошибок мы должны быть более обеспокоены. Функция наилучшего решения - это функция, которая дает наименьшую ожидаемую потерю . Что подразумевается под ожидаемой потерей, зависит от обстановки (в частности, говорим ли мы о частых или байесовских статистических данных).

В итоге:

  • Функции принятия решений используются для принятия решений на основе данных.
  • Функции потерь используются, чтобы определить, какую функцию принятия решения использовать.

Для функций параметрического решения (например, логистическая регрессия, пороговое решение) у вас в основном есть одна возможная функция для каждой комбинации параметров, а функция потерь используется для поиска наилучшей. Типичный пример: если вы используете градиентный спуск, чтобы исследовать пространство параметров, вы выводите потери по параметрам и снижаете до (локального) минимума потерь.
pixelou

7

Функция потерь - это то, что минимизируется, чтобы получить модель, которая в некотором смысле является оптимальной. Сама модель имеет решающую функцию, которая используется для прогнозирования.

Например, в классификаторах SVM:

  • функция потерь: минимизирует погрешность и норму квадрата разделяющей гиперплоскости L(вес,ξ)знак равно12| |вес| |2+СΣяξя
  • Функция принятия решения: расстояние со знаком до разделяющей гиперплоскости: е(Икс)знак равновесTИкс+б

Разве норма не равна расстоянию, или я что-то здесь перепутал ... Итак, функция принятия решений всегда является частью функции потерь, которую я использую, чтобы «сравнить» с реальными значениями, к которым я пытаюсь привязать модель? И цель минимизировать эту «разницу»?
www.pieronigro.de

@Hiatus норма разделяющей гиперплоскости (которая оптимизируется при обучении SVM) не используется в функции принятия решения. Сама гиперплоскость используется. Минимизация нормы во время обучения - в основном форма регуляризации.
Марк Класен

Было бы лучше дать более общий ответ, который не привязан к какому-либо конкретному классификатору.
smci
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.