Просто добавив это пояснение, чтобы каждый, кто прокручивает эту страницу, по крайней мере, понял ее правильно, поскольку за многие проголосовали неправильные ответы.
Diansheng в ответ и JakeJ в ответ получить это право.
Новый ответ Написал Shital Shah является еще лучше и более полным ответом.
Да, logit как математическая функция в статистике, но logitв контексте нейронных сетей используется другое. Статистика logitдаже не имеет здесь никакого смысла.
Я нигде не мог найти формальное определение, но в logitосновном это означает:
Необработанные прогнозы, которые выходят из последнего слоя нейронной сети.
1. Это тот самый тензор, к которому вы применяете argmaxфункцию, чтобы получить предсказанный класс.
2. Это тот самый тензор, который вы вводите в softmaxфункцию, чтобы получить вероятности для предсказанных классов.
Кроме того, из учебного пособия на официальном сайте tenorflow:
Logits Layer
Последний слой в нашей нейронной сети - это уровень logits, который будет возвращать необработанные значения для наших прогнозов. Мы создаем плотный слой с 10 нейронами (по одному на каждый целевой класс 0–9) с линейной активацией (по умолчанию):
logits = tf.layers.dense(inputs=dropout, units=10)
Если вы все еще в замешательстве, ситуация такова:
raw_predictions = neural_net(input_layer)
predicted_class_index_by_raw = argmax(raw_predictions)
probabilities = softmax(raw_predictions)
predicted_class_index_by_prob = argmax(probabilities)
где predicted_class_index_by_rawи predicted_class_index_by_probбудет равен.
Другое название raw_predictionsв приведенном выше кодеlogit .
Что касается почему logit ... Я понятия не имею. Сожалею.
[Изменить: см. Этот ответ для исторических мотивов этого термина.]
пустяки
Хотя, если вы хотите, вы можете применить статистические logitк , probabilitiesчто выйти из softmaxфункции.
Если вероятность определенного класса равна p,
то лог-шансы этого класса равны L = logit(p).
Кроме того, вероятность этого класса может быть восстановлена как p = sigmoid(L), используя sigmoidфункцию.
Хотя это не очень полезно для расчета лог-шансов.