Я работаю над некоторым программным обеспечением, которое должно определять местоположение в реальном мире (например, скоростные камеры) из нескольких отчетов на основе GPS . Пользователь будет управлять автомобилем при сообщении местоположения, поэтому отчеты очень неточные. Чтобы решить эту проблему, я должен сгруппировать отчеты о том же месте и вычислить среднее.
Мой вопрос о том, как кластеризовать эти отчеты . Я читал об алгоритмах ожидания-максимизации и кластеризации k-средних , но, как я понял, мне нужно заранее определить количество реальных мест.
Существуют ли другие алгоритмы, которым не нужно точное количество реальных местоположений, но вместо этого используются некоторые граничные условия (например, минимальное расстояние)?
Отчет содержит долготу , широту и точность (в метрах). Нет имени или чего-либо еще, что можно было бы использовать для идентификации дубликатов.
Еще одно препятствие может заключаться в том, что для реального местоположения будет только один отчет. Это мешает отличить выбросы от достоверных данных.