Этот ответ описывает объективный метод измерения произвольных расхождений между двумя пространственными наборами данных. Такие расхождения могут включать в себя сдвиги положения, изменения формы и особенности, присутствующие в одном наборе данных, но не в другом. Этот ответ не предоставляет никаких средств для определения того, что «лучше», потому что это зависит не только от данных, а от того, для чего эти данные будут использоваться.
Фон
Хорошая основа для большого набора таких измерений опирается на евклидово преобразование расстояний каждого набора данных. Это рассматривает каждый набор данных как представление набора точек на плоскости. Давайте назовем эти коллекции B для синих элементов и R для красных элементов.
Для любой точки х в плоскости, евклидово расстояния преобразования из множества точек вычисляет нижнюю грань расстояний между й и А . Мы можем думать , это преобразование , как создание «поверхности», высота которого при х равно кратчайшее расстояние от й до А . Таким образом , эта поверхность имеет впадины во всех точках А , где его высота равна нуль, и поднимается на 1: 1 склон от A . Ясно, что преобразование расстояния в свою очередь определяет A (или технически его метрическое замыкание , которое для наборов данных ГИС такое же, как A) как множество всех точек на высоте ноль. Таким образом, преобразование расстояния полностью захватывает всю пространственную информацию A, которую ГИС способна представить.
На этом рисунке показаны преобразования расстояния B (слева) и R (справа) в псевдорельефе.
Сравнение двух наборов данных
Чтобы сравнить B и R , наложите каждое на преобразование расстояния другого:
Значения расстояния отображаются в виде цветов, градуированных от синего (около 0) до красного.
Левая карта, например, показывает точки B и цвет их в соответствии с их расстояниями от R . Роли B и R поменялись на правой карте.
Уже это помогает глазу проводить сравнения: каждая карта показывает точки одного набора данных и, используя цвет, выделяет точки, которые находятся далеко от любой точки в другом наборе данных. Обратите внимание, что обе карты необходимы для сравнения, потому что каждая показывает точки не на другой.
На подробных картах цвет может быть трудно различим, поэтому мы можем немного размыть его для представления или визуальной оценки:
Примечание: цвета не сопоставимы между двумя картами: внутри каждой карты они масштабируются, чтобы показать полный диапазон расстояний на этой карте.
Статистический анализ различий
Прелесть этого подхода заключается в том, что можно сделать в постобработке. Используя растр для представления преобразований расстояний и их наложений, мы можем легко получить статистические данные - локальные и глобальные - для измерения расхождений. Например, мы могли бы сосредоточиться на всех расстояниях, превышающих некоторый небольшой порог, для изучения их частотного распределения:
В этой гистограмме синие столбцы обозначают синие элементы, а красные - красные. (Обратите внимание на логарифмический масштаб на горизонтальной оси.) Эта гистограмма показывает исходные наложенные данные, а не производные размытые данные. Он выбрал только те расстояния больше трех пикселей в исходном изображении.
Эти гистограммы показывают, что синие объекты гораздо чаще находятся далеко от красных объектов, чем наоборот : синие полосы выше красных и простираются на большие расстояния (справа). Весь арсенал описательной статистики теперь доступен для количественной оценки различий между двумя наборами данных. Эта статистика может быть применена ко всей интересующей области или «оконной» над ней, чтобы изучить, как эти два набора данных различаются в зависимости от местоположения.
Реализация
Большинство растровых ГИС обеспечивают евклидово дистанционное преобразование (например, EuclideanDistance в ArcGIS и r.grow.distance в GRASS), и все поддерживают простое (маскирующее) наложение, необходимое для этого анализа. Размытие, при желании, может быть выполнено с помощью среднего значения соседства или свертки ядра (которое включает в себя «размытие по Гауссу», доступное во всех программах обработки изображений). Большинство GISes этого не обеспечивает адекватную поддержку полного статистического анализа растровых данных, хотя, но они хороши при экспорте таких данных в форматах , читаемые статистическим и программно - математического обеспечение , такие как R
или Mathematica (который сделал все цифры здесь).