Этот вопрос начинался как « Кластеризация пространственных данных в R », а теперь перешел к вопросу DBSCAN.
Поскольку ответы на первый вопрос подсказали, я искал информацию о DBSCAN и прочитал несколько документов о. Новые вопросы возникли.
DBSCAN требует некоторых параметров, одним из которых является «расстояние». Как мои данные являются трехмерными, долгота, широта и температура, какое «расстояние» я должен использовать? какое измерение связано с этим расстоянием? Я полагаю, это должна быть температура. Как мне найти такое минимальное расстояние с R?
Другим параметром является минимальное количество точек, необходимых для формирования кластера. Есть ли способ найти это число? К сожалению, я не нашел.
Поиск в Google Я не смог найти пример R для использования dbscan в наборе данных, похожем на мой, знаете ли вы какой-либо веб-сайт с такими примерами? Поэтому я могу читать и пытаться приспособиться к своему делу.
Последний вопрос заключается в том, что моя первая попытка R с DBSCAN (без правильного ответа на предыдущие вопросы) привела к проблеме с памятью. R говорит, что не может выделить вектор. Я начинаю с разнесенной на 4 км сетки с 779191 точками, которая заканчивается при удалении недопустимых точек SST приблизительно 300000 строк x 3 столбца (широта, долгота и температура). Любой намек на решение этой проблемы с памятью. Зависит ли это от моего компьютера или от самого DBSCAN?
Спасибо за терпение, чтобы прочитать длинное и, вероятно, скучное сообщение и за вашу помощь.