У меня есть набор данных и я хочу найти параметр m такой, чтобы он минимизировал сумму k ∑ i = 1 | м - х я | , то есть
У меня есть набор данных и я хочу найти параметр m такой, чтобы он минимизировал сумму k ∑ i = 1 | м - х я | , то есть
Ответы:
Возможно, вы просите доказательства того, что медиана решает проблему? Ну, это можно сделать так:
Цель является кусочно-линейной и, следовательно, дифференцируемой, за исключением точек . Каким наклоном объектива является некоторая точка m ≠ x i ? Ну, наклон - это сумма наклонов отображений m ↦ | м - х J | и это либо + 1 (для m > x j ), либо - 1 (для m < x j ). Следовательно, наклон показывает, сколько x i меньше, чем m . Вы видите, что наклон равен нулю, если есть одинаково много меньше и больше, чем m (для и четного числа » s). Если есть нечетное число х я «Sто наклон - 1 слева от„middlest“один и + 1 право его, следовательно, middlest один является минимальным.
Обобщение этой задачи на множественные измерения называется геометрической срединной задачей . Как указывает Дэвид, медиана является решением для одномерного случая; там вы могли бы использовать алгоритмы выбора медианного поиска , которые более эффективны, чем сортировка. Сорта а алгоритмы выбора O ( n ) ; сортировки более эффективны, только если необходимо несколько вариантов выбора, и в этом случае вы можете отсортировать (дорого) один раз, а затем повторно выбирать из отсортированного списка.
В ссылке на геометрическую задачу о медиане упоминаются решения для многомерных случаев.