Просто добавив это пояснение, чтобы каждый, кто прокручивает эту страницу, по крайней мере, понял ее правильно, поскольку за многие проголосовали неправильные ответы.
Diansheng в ответ и JakeJ в ответ получить это право.
Новый ответ Написал Shital Shah является еще лучше и более полным ответом.
Да, logit
как математическая функция в статистике, но logit
в контексте нейронных сетей используется другое. Статистика logit
даже не имеет здесь никакого смысла.
Я нигде не мог найти формальное определение, но в logit
основном это означает:
Необработанные прогнозы, которые выходят из последнего слоя нейронной сети.
1. Это тот самый тензор, к которому вы применяете argmax
функцию, чтобы получить предсказанный класс.
2. Это тот самый тензор, который вы вводите в softmax
функцию, чтобы получить вероятности для предсказанных классов.
Кроме того, из учебного пособия на официальном сайте tenorflow:
Logits Layer
Последний слой в нашей нейронной сети - это уровень logits, который будет возвращать необработанные значения для наших прогнозов. Мы создаем плотный слой с 10 нейронами (по одному на каждый целевой класс 0–9) с линейной активацией (по умолчанию):
logits = tf.layers.dense(inputs=dropout, units=10)
Если вы все еще в замешательстве, ситуация такова:
raw_predictions = neural_net(input_layer)
predicted_class_index_by_raw = argmax(raw_predictions)
probabilities = softmax(raw_predictions)
predicted_class_index_by_prob = argmax(probabilities)
где predicted_class_index_by_raw
и predicted_class_index_by_prob
будет равен.
Другое название raw_predictions
в приведенном выше кодеlogit
.
Что касается почему logit
... Я понятия не имею. Сожалею.
[Изменить: см. Этот ответ для исторических мотивов этого термина.]
пустяки
Хотя, если вы хотите, вы можете применить статистические logit
к , probabilities
что выйти из softmax
функции.
Если вероятность определенного класса равна p
,
то лог-шансы этого класса равны L = logit(p)
.
Кроме того, вероятность этого класса может быть восстановлена как p = sigmoid(L)
, используя sigmoid
функцию.
Хотя это не очень полезно для расчета лог-шансов.