Есть много способов измерить, насколько похожи два вероятностных распределения. Среди методов, которые популярны (в разных кругах):
Колмогоровское расстояние: расстояние между функциями распределения;
расстояние Канторовича-Рубинштейна: максимальная разница между ожиданиями относительно двух распределений функций с постоянной Липшица , которая также оказывается расстоянием между функциями распределения;
расстояние с ограничением по Липшицу: как и расстояние KR, но функции также должны иметь абсолютное значение не более .
Они имеют разные преимущества и недостатки. Только сходимость в смысле 3. на самом деле точно соответствует сходимости в распределении; сходимость в смысле 1. или 2. в целом немного сильнее. (В частности, если с вероятностью, тосходится кпо распределению, но не по колмогоровскому расстоянию. Однако, если предельное распределение непрерывно, патология не возникает.)
С точки зрения элементарной теории вероятности или меры 1. очень естественен, поскольку сравнивает вероятности нахождения в некотором множестве. С другой стороны, более изощренная вероятностная перспектива имеет тенденцию больше фокусироваться на ожиданиях, чем на вероятностях. Кроме того, с точки зрения функционального анализа расстояния типа 2. или 3., основанные на двойственности с некоторым функциональным пространством, очень привлекательны, потому что существует большой набор математических инструментов для работы с такими вещами.
Однако у меня сложилось впечатление (поправьте меня, если я ошибаюсь!), Что в статистике колмогоровское расстояние является обычно предпочтительным способом измерения подобия распределений. Я могу предположить одну причину: если одно из распределений является дискретным с конечной поддержкой - в частности, если это распределение некоторых реальных данных - тогда расстояние Колмогорова до модельного распределения легко вычислить. (Расстояние KR будет немного сложнее вычислить, а расстояние BL, вероятно, будет невозможно в практическом плане.)
Таким образом, мой вопрос (наконец) заключается в том, существуют ли другие причины, практические или теоретические, в пользу колмогоровского расстояния (или некоторого другого расстояния) для статистических целей?