Может кто-нибудь объяснить мне концепцию расстояния Махаланобиса? Например, каково расстояние Махаланобиса между двумя точками x и y, и особенно, как оно интерпретируется для распознавания образов?
Может кто-нибудь объяснить мне концепцию расстояния Махаланобиса? Например, каково расстояние Махаланобиса между двумя точками x и y, и особенно, как оно интерпретируется для распознавания образов?
Ответы:
Расстояние Махаланобиса дает возможность измерить, насколько подобный набор условий похож на известный набор условий. Он учитывает ковариацию среди переменных.
Он рассчитывается как: где: D 2
Эта страница содержит подробное объяснение (с примерами из анализа ландшафта).
Расстояние Махаланобиса используется для нахождения выбросов в наборе данных. Я не знаю, в какой области вы находитесь, но в психологии это используется для выявления случаев, которые не «вписываются» в то, что ожидается, учитывая нормы для набора данных. Например, если ваша выборка состоит из людей с низким уровнем депрессии, и у вас есть один или два человека с очень высоким уровнем депрессии, то у них будут расстояния Махаланобиса, которые превышают ожидаемое критическое значение. Возможно, вы захотите удалить эти случаи, если они очень экстремальные И если вы считаете, что они не вписываются в ваш набор данных. (Используя приведенный пример, ваша выборка состоит из людей с низким уровнем депрессии, поэтому один или два человека с высоким уровнем депрессии не соответствуют остальным). Выявление выбросов очень важно, потому что многие статистические анализы имеют «допущение нормальности», то есть ожидание, что ваши данные будут нормально распределены. Выбросы также могут вносить вклад в искаженные данные, и по этой причине они также должны быть удалены. (Если вы не преобразуете всю переменную, и это не исправляет перекос). Многие программы статистики, такие как SPSS, позволяют вычислять расстояния M и вероятность, связанную с каждым показателем, чтобы идентифицировать выбросы. Я могу предоставить вам инструкции SPSS, но я не знаю, используете ли вы SPSS. (Если вы не преобразуете всю переменную, и это не исправляет перекос). Многие программы статистики, такие как SPSS, позволяют вычислять расстояния M и вероятность, связанную с каждым показателем, чтобы идентифицировать выбросы. Я могу предоставить вам инструкции SPSS, но я не знаю, используете ли вы SPSS. (Если вы не преобразуете всю переменную, и это не исправляет перекос). Многие программы статистики, такие как SPSS, позволяют вычислять расстояния M и вероятность, связанную с каждым показателем, чтобы идентифицировать выбросы. Я могу предоставить вам инструкции SPSS, но я не знаю, используете ли вы SPSS.