Прогнозирование доверия нейронной сети

Предположим, я хочу обучить глубокую нейронную сеть выполнять классификацию или регрессию, но я хочу знать, насколько достоверным будет прогноз. Как я мог этого добиться?

Моя идея состоит в том, чтобы вычислить кросс-энтропию для каждого тренировочного материала, основываясь на его прогнозирующей способности в нейросчетчиках выше. Затем я подготовил бы вторую нейронную сеть для регрессии, которая взяла бы каждый элемент данных в качестве входных данных, а перекрестную энтропию - в качестве выходных данных (один выходной узел). Затем вы будете использовать обе сети на практике - одну для прогнозирования метки / значения, а другую для прогнозирования достоверности первой сети. (.... Но нужна ли мне тогда третья сеть для прогнозирования доверия ко второй сети и т. Д.?!)

Это правильная идея? Кроме того, это стандартная идея обычно используется? Если нет, что бы вы предложили?

machine-learning neural-networks

— Karnivaurus
источник

Прогнозные значения можно интерпретировать как достоверность.

— yasin.yazici

Возможно, вы можете использовать метод начальной загрузки, реплицируя вашу модель на n выборок и создавая оценку дисперсии и, возможно, доверительный интервал для своих прогнозов.

— Д.Кастро

Для классификации, как ответили некоторые, вероятности сами по себе являются мерилом вашей уверенности. Для регрессии мой ответ на очень похожий вопрос может оказаться полезным.

— этно

Смотрите мой ответ на аналогичный вопрос здесь stats.stackexchange.com/a/247568/56940

— Utobi

Ответы:

Возможно, я неправильно понимаю вопрос, но для классификации мне кажется, что стандартным способом является наличие выходного нейрона для каждого из Nклассов.

Тогда Nвектор [0, 1]выходных значений представляет вероятность входных данных, принадлежащих каждому классу, и поэтому может быть интерпретирован как «достоверность», которую вы хотите получить.

— giorgiosironi
источник

[0, 1]

$[0,1]$

Для тех, кто интересуется оценкой достоверности прогноза NN, вы можете взглянуть на Dropout как байесовское приближение: представление неопределенности модели в глубоком обучении (Gal et al., 2016) . Вкратце, он демонстрирует, как дисперсия предсказаний сети с выпадением по совокупности прогонов, в которых выполняется отсев, может использоваться для оценки достоверности предсказания. Этот подход может использоваться для сетей, предназначенных для классификации или регрессии.

— lebedov
источник