http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/
Если вы посмотрите на верхнюю часть этого поста, автор упомянет, что норма L2 имеет уникальное решение, а норма L1, возможно, имеет много решений. Я понимаю это с точки зрения регуляризации, но не с точки зрения использования нормы L1 или нормы L2 в функции потерь.
Если вы посмотрите на графики функций скаляра x (x ^ 2 и | x |), вы легко увидите, что оба имеют одно уникальное решение.