Почему бета-оценка определяет бета как это?


10

Это бета-оценка F:

Fβзнак равно(1+β2)пресяsяоNресaLL(β2пресяsяоN)+ресaLL

В статье Википедии говорится, что .Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

Я не понял идею. Зачем определять так? Могу ли я определить следующим образом:βFβ

Fβзнак равно(1+β)пресяsяоNресaLL(βпресяsяоN)+ресaLL

А как показать β times as much importance?


2
Ознакомьтесь с более новым ответом ниже, который включает в себя дифференциальное исчисление, в котором говорится, «почему бета в квадрате, а не бета».
Джавадба

Ответы:


19

Позволить быть весом в первом определении вы предоставляете и веса во втором, два определения эквивалентны при установке , так что эти два определения представляют собой лишь обозначения различия в определение балла. Я видел, что он определил как первый путь (например, на странице википедии ), так и второй (например, здесь ).˜ β ˜ β = β 2 F βββ~β~знак равноβ2Fβ

мера получаются, если взять средние гармоническую точность и отзыва, а именно обратные среднего значение обратной точности и обратный вызова:F1

F1знак равно1121точность+121отзывзнак равно2точностьотзывточность+отзыв

Вместо использования весов в знаменателе, которые равны и составляют 1 ( для повторного вызова и для точности), мы могли бы вместо этого назначить веса, которые все еще суммируют с 1, но для вес которого при возврате в раза больше веса при точности ( для отзыва и для точности). Это даст вам второе определение : 112 ββ12β 1ββ+1 Fβ1β+1Fβ

Fβзнак равно11β+11точность+ββ+11отзывзнак равно(1+β)точностьотзывβточность+отзыв

Опять же, если бы мы использовали здесь вместо мы бы пришли к вашему первому определению, поэтому различия между этими двумя определениями просто обозначены. ββ2β


1
почему они умножили на термин точности вместо термина отзыва? β
Анварвик

1
Дифференциальное исчисление, которое учитывает «почему бета- квадрат, а не бета», включено в более новый ответ ниже.
Джавадба

@ Anwarvic Они умножили на обратный отзыв. После факторизации и расширяется с есть термин влевоТочность β ( 1 + β ) Напоминание β Точностьβ(1+β)precisionrecallβточность
user2740

6

Причиной определения оценки F-бета с помощью является именно та цитата, которую вы предоставляете (т.е. хотите придать раз большую важность, чтобы вспомнить ее точность), учитывая конкретное определение того, что значит прикреплять раз важнее вспомнить, чем точность.β2ββ

Конкретный способ определения относительной важности двух метрик, которые приводят к формулировке можно найти в информационном поиске (Van Rijsbergen, 1979):β2

Определение: Относительная важность, которую пользователь придает точности и отзыву, - это отношение при котором , где мера эффективности, основанная на точности и отзыве.п/рЕ/рзнак равноЕ/пЕзнак равноЕ(п,р)

Мотивация для этого существа:

Самый простой способ измерить это - определить отношение при котором пользователь готов обменять приращение на точность на равную потерю при отзыве.п/р

Для того, чтобы видеть , что это приводит к препарат можно начать с общей формулой для взвешенного гармонического среднего и , и вычислить их частные производные по отношению к и . Источник привел польз (для «эффективности мер»), который находится всего и объяснение эквивалентно , рассматривается ли или .β2прпрЕ1-FЕF

Fзнак равно1(αп+1-αр)

F/пзнак равноα(αп+1-αр)2п2

F/рзнак равно1-α(αп+1-αр)2р2

Теперь, установив производные равны друг другу накладывает ограничение на взаимосвязи между и соотношение . Учитывая, что мы хотим придать раз столько важности, чтобы вспомнить, сколько точности, мы рассмотрим соотношение 1 :αп/рβр/п

F/пзнак равноF/рαп2знак равно1-αр2рпзнак равно1-αα

Определение как этого отношения и перестановка для дает весовые коэффициенты в терминах :βαβ2

βзнак равно1-ααβ2знак равно1-ααβ2+1знак равно1ααзнак равно1β2+1

1-αзнак равно1-1β2+1β2β2+1

Мы получаем:

Fзнак равно1(1β2+11п+β2β2+11р)

Который можно переставить, чтобы придать форму в вашем вопросе.

Таким образом, учитывая приведенное определение, если вы хотите придать раз столько важности, чтобы вспоминать как точность, то следует использовать формулировку . Эта интерпретация не выполняется, если кто-то использует . Эквивалентная, менее интуитивная интерпретация в случае, когда мы просто используем будет состоять в том, что мы хотим придать раз большую важность, чтобы вызывать точность.ββ2βββ

Вы можете определить оценку так, как вы предлагаете, однако вы должны знать, что в этом случае либо обсуждаемая интерпретация больше не действует, либо вы подразумеваете какое-то другое определение для количественной оценки компромисса между точностью и отзывом.

Примечания:

  1. п/р используется в информационном поиске, но, похоже, это опечатка, см . Истину F-меры (Saski, 2007).

Ссылки:

  1. Си Джей Ван Рейсберген. 1979. Информационный поиск (2-е изд.), С. 133-134.
  2. Ю. Сасаки. 2007. «Правда F-меры», Учебно-методические материалы

1
Это должен быть принятый ответ.
Джавадба

3

Чтобы указать что-то быстро.

Это означает, что с увеличением значения бета вы цените точность больше.

Я на самом деле думаю, что все наоборот - так как чем выше оценка F-β, тем лучше, чтобы знаменатель был маленьким. Поэтому, если вы уменьшите β, то модель будет наказана меньше за хорошую оценку точности. Если вы увеличиваете β, то показатель F-β наказывается больше, когда точность высокая.

Если вы хотите взвесить оценку F-β так, чтобы она оценивала точность, β должно быть 0 <β <1, где β-> 0 оценивает только точность (числитель становится очень маленьким, и единственное, что в знаменателе - это отзыв, таким образом, показатель F-β уменьшается по мере увеличения числа отзывов).

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

Причина, по которой β ^ 2 умножается с точностью, заключается именно в том, как определяются F-баллы. Это означает, что с увеличением значения бета вы цените точность больше. Если вы хотите умножить его на отзыв, это также сработает, это будет означать, что при увеличении значения бета вы увеличиваете значение отзыва.


0

Значение бета больше 1 означает, что мы хотим, чтобы наша модель уделяла больше внимания модели Recall по сравнению с Precision. С другой стороны, значение меньше 1 делает больший акцент на точности.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.