Я хотел бы добавить третью причину к правильным причинам, приведенным Харреллом и Фломом. Причина в том, что мы используем евклидово расстояние (или L2), а не манхэттенское расстояние (или L1) в качестве нашей стандартной меры близости или ошибки. Если у кого-то есть количество точек данных и кто-то хочет, чтобы его оценило одно число θ , очевидным понятием будет найти число, которое минимизирует «ошибку», что число создает наименьшую разницу между выбранным числом и числа, которые составляют данные. В математической записи для данной функции ошибки E нужно найти m i n θ ∈ R ( E ( θ ,x1,…xnθ . Если взять за E (x, y) норму или расстояние L2, то есть E ( x , y ) = ( x - y ) 2, то минимизатор по всем θ ∈ R является средним. Если взять расстояние L1 или Манхэттен, минимизатор по всемminθ∈R(E(θ,x1,…xn)=minθ∈R(∑i=ni=1E(θ,xi))E(x,y)=(x−y)2θ∈R - медиана. Таким образом, среднее значение является естественным математическим выбором - если использовать расстояние L2!θ∈R