К сожалению, на данный момент принятый @Sycorax ответ, хотя и подробный, неверен.
На самом деле, это яркий пример регрессии через категорический кросс-энтропию - WaveNet - был реализован в TensorFlow .
Принцип заключается в том, что вы дискретизируете свое выходное пространство, и тогда ваша модель только предсказывает соответствующий бин; см. раздел 2.2 статьи для примера в области моделирования звука. Таким образом, хотя технически модель выполняет классификацию, конечной решаемой задачей является регрессия.
Очевидным недостатком является то, что вы теряете выходное разрешение. Тем не менее, это может не быть проблемой (по крайней мере, я думаю, что искусственный помощник Google говорил очень человечно ), или вы можете поиграть с некоторой постобработкой, например, интерполяцией между наиболее вероятным мусорным ведром и его двумя соседями.
С другой стороны, этот подход делает модель намного более мощной по сравнению с обычным выходом из одной линейной единицы, то есть позволяет выражать мультимодальные прогнозы или оценивать ее достоверность. Обратите внимание, что последнее может быть естественным образом достигнуто с помощью других средств, например, с помощью явного (логического) вывода дисперсии, как в вариационных автоэнкодерах.
В любом случае, этот подход плохо масштабируется до многомерного вывода, потому что тогда размер выходного слоя растет экспоненциально, что делает его как вычислительным, так и модельным.