При работе с растрами с разным разрешением следует пересчитывать изображение на самое высокое или самое низкое разрешение?


16

Я ищу рекомендации по передовым методам работы с слоями растровых данных с различными разрешениями и проекциями. Совет, который мне дали, - всегда повторять выборку слоя с наименьшим разрешением перед выполнением любого анализа, но мне это кажется огромной тратой точности, и мне никогда не давали четкого объяснения, почему это нужно делать.

Когда целесообразно выполнить повторную выборку, чтобы соответствовать сетке с более высоким разрешением, и каковы последствия по сравнению с повторной выборкой с более низким разрешением?

Я понимаю, что это, вероятно, сильно зависит от ситуации. Я в основном ищу общие рекомендации, но вот мой конкретный сценарий для справки:

Сценарий: я собираюсь построить модель пространственной регрессии, прогнозирующую использование земли, основанную на различных экологических и социально-экономических слоях. Моя карта землепользования получена от Landsat и, следовательно, имеет разрешение 30 м. Примеры пояснительных слоев включают DEM SRTM (3 угловых секунды, ~ 90 м) и климатические слои Bioclim (30 угловых секунд, ~ 1 км).


1
Не могли бы вы предоставить больше информации о регрессионной модели и методе реализации? +1 за хорошо построенный, интересный вопрос!
Аарон

Я сравниваю лесной покров в два момента времени и использую модель логистической регрессии с (двоичной) вероятностью вырубки леса в качестве моего ответа. Я реализую это в R.
Matt SM

Ответы:


17

На самом деле все зависит не от ситуации, а от статистической ошибки.

Каждый раз, когда вы повторно выбираете изображение с более высоким разрешением, вы вводите ложную точность. Рассмотрим набор данных, измеренный в футах только для целых чисел. Любая данная точка может быть на расстоянии +/- 0,5 фута от ее фактического местоположения. Если вы сделаете выборку с точностью до десятой доли, вы теперь скажете, что любое данное число не более +/- 0,1 от его фактического местоположения. Тем не менее, вы знаете, что ваши исходные измерения были не такими точными, и теперь вы работаете в пределах погрешности. Однако, если вы пойдете другим путем и выполните повторную выборку с более низким разрешением, вы знаете, что любое заданное значение точки определенно является точным, поскольку оно содержится в пределах погрешности большей выборки.

Помимо статистической математики, первое, что приходит на ум, - это геодезия. В более старых исследованиях указывались только подшипники с точностью до полминуты и расстояния до десятой доли фута. Построение пересечения границы с этими измерениями часто может привести к неправильному замыканию (начальная точка и конечная точка должны быть одинаковыми, но не должны) измеряться в футах. Современные обзоры идут по крайней мере с точностью до секунды и сотни футов. Производные значения (например, площадь участка) могут существенно зависеть от разницы в точности. Само производное значение также может быть дано как слишком точное.

В вашем случае анализа, если вы выполните выборку с более высоким разрешением, ваши результаты будут иметь гораздо большую точность, чем данные, на которых они основаны. Рассмотрим ваш SRTM на 90м. Каким бы методом они не измеряли высоту (среднее / максимальное / среднее значение), наименьшая единица (пиксель), которую можно отличить от соседей, составляет 90 метров. Если вы пересчитаете это до 30 м, либо:

  • Вы предполагаете, что все девять из полученных пикселей имеют ту же высоту, когда на самом деле может быть только один - центр или верхний левый - (или ни один!)
  • Вы интерполируете между пикселями, создавая производные значения, которых раньше не было

Таким образом, в обоих случаях вы вводите ложную точность, потому что ваши новые подвыборки фактически не измерялись.

Смежный вопрос: Какие методы доступны для моделирования пригодности земли?


Это, безусловно, верно для точечных данных. Но мне интересно, отличается ли это для растровых данных, которые усредняют непрерывно изменяющуюся пространственную величину, где есть точность местоположения и точность измеренной величины. Кроме того, разные величины имеют разные уровни пространственного изменения. Например, повторная выборка данных высот с более высоким разрешением должна вносить больше ошибок в горных районах, чем в прериях.
Мэтт С.М.

@MattSM Это верно для всех пространственных данных и усугубляется статистической ошибкой измеренной величины. Рассмотрим ваш SRTM на 90м. Каким бы методом они не измеряли высоту (среднее / максимальное / среднее значение), наименьшая единица (пиксель), которую можно отличить от соседей, составляет 90 метров. Если вы повторно выберете это значение до 30 м, вы теперь скажете, что все 9 из полученных пикселей имеют ту же высоту, когда на самом деле может быть только один (или ни один!) - центр или верхний левый угол. Или вы интерполируете между пикселями, создавая значения, которых раньше не было, что дает ложную точность. И да, диапазон значений играет на потенциальную ошибку.
Крис W

В качестве дополнительного примечания можно интерполировать определенные особенности в особых случаях, когда шаблон явно ограничен - одна негеографическая особенность, которая приходит на ум, - это восстановление информации номерного знака из фотографий с слишком низким разрешением для чтения. Но вы должны знать, на что вы смотрите. Я помню некоторые случаи, когда реконструкция номерного знака не удалась, потому что рассматриваемая табличка была написана неевропейским шрифтом, таким как арабский.
Стив Барнс

Как насчет растров с разрешением на основе дуг, разве у них нет ячеек сетки, которые могут иметь разные области / пропорции в разных областях?
CMCDragonkai

@CMCDragonkai Я не уверен, как решить эту проблему, потому что вы получаете представление данных в сравнении с форматом и системами координат / проекциями. Да, географическая область в растре не обязательно является такой же однородной, как квадратные (или другие пропорции) пиксели. Об этом вам расскажут многие спецификации спутниковых данных (пиксель - это x на надире и y на краю полосы). Но проблемы повторной выборки все еще применяются - если что-нибудь это только усугубляет проблему. (И извините за задержку, я не был на SE в течение некоторого времени.)
Крис W
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.