Вопрос говорит обо всем. Я читал, что нельзя обобщить KS до измерения, равного или большего, чем два , и что известные реализации, подобные этой в Числовых Рецептах , просто неверны. Не могли бы вы объяснить, почему это так?
Вопрос говорит обо всем. Я читал, что нельзя обобщить KS до измерения, равного или большего, чем два , и что известные реализации, подобные этой в Числовых Рецептах , просто неверны. Не могли бы вы объяснить, почему это так?
Ответы:
Я полагаю, что законно процитировать соответствующую часть рассматриваемого абзаца:
3. Тест KS нельзя применять в двух или более измерениях. Астрономы часто имеют наборы данных с точками, распределенными в плоскости или более высоких измерениях, а не вдоль линии. Несколько статей в астрономической литературе имеют целью представить двумерный тест KS, а один воспроизведен в известном томе «Численные рецепты». Однако ни один тест на основе EDF (включая KS, AD и связанные с ним тесты) не может быть применен в двух или более измерениях, поскольку не существует уникального способа упорядочить точки, чтобы можно было рассчитать расстояния между четко определенными EDF. Можно построить статистику на основе некоторой процедуры упорядочения, а затем вычислить супремумные расстояния между двумя наборами данных (или одним набором данных и кривой). Но критические значения полученной статистики не распространяются бесплатно.
Как уже говорилось, это кажется слишком сильным.
1) Двусторонняя функция распределения, которая является является отображением из в . То есть функция принимает одномерные действительные значения от 0 до 1. Эти значения - вероятности - уже, безусловно, «упорядочены» - и это (значение функции) - то, с чем нам нужно сравнивать тесты на основе ECDF. , Точно так же ecdf, совершенно хорошо определен в двумерном случае.
Я не думаю, что обязательно нужно пытаться превратить его в некоторую функцию одномерной комбинированной переменной, как предлагает текст. Вы просто вычисляете и для каждой требуемой комбинации и вычисляете разницу.
2) Однако, на вопрос о том, распространяется ли он бесплатно, у них есть смысл:
a) ясно, что такая тестовая статистика не будет изменена изменениями в преобразованиях полей, то есть, если она построена как тест двумерных независимых форм, , то она работает одинаково а также тест независимых где . В этом смысле он не распространяется (мы можем сказать «без полей»).
б) тем не менее, в более широком смысле существует базовый момент, заключающийся в том, что наивный вариант статистики KS (такой, как я только что описал) не является более распространяемым; мы не можем просто произвольно преобразовать .
В более ранней версии моего ответа я сказал:
Нет проблем, нет проблем
Это неверно. Есть действительно проблемы, если есть изменение не только полей от двухмерной независимой формы, как только что упомянуто. Тем не менее, эти трудности были рассмотрены несколькими способами в ряде работ, которые дают двумерные / многомерные версии статистики Колмогорова-Смирнова, которые не страдают от этой проблемы.
Я могу вернуться и добавить некоторые из этих ссылок и некоторые обсуждения того, как они работают, как только позволит время.