У меня есть набор данных событий, которые произошли за тот же период времени. Каждое событие имеет тип (есть несколько разных типов, меньше десяти) и местоположение, представленное в виде 2D-точки.
Я хотел бы проверить, есть ли какая-либо корреляция между типами событий, или между типом и местоположением. Например, может быть, события типа A обычно не происходят там, где происходят события типа B. Или, может быть, в какой-то области, в основном, есть события типа C.
Какие инструменты я могу использовать для этого? Будучи новичком в статистическом анализе, моя первая идея состояла в том, чтобы использовать какой-либо PCA (Анализ основных компонентов) в этом наборе данных, чтобы увидеть, имеет ли каждый тип события свой собственный компонент, или, может быть, некоторые имеют одинаковый (то есть коррелированный)?
Я должен упомянуть, что мой набор данных имеет порядок 500 000 точек , что усложняет задачу.
РЕДАКТИРОВАТЬ: Как отмечается в ответах ниже и в комментариях, можно смоделировать этот процесс как отмеченный точечный процесс, а затем использовать R для выполнения всей тяжелой работы, как подробно описано в этом отчете семинара: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html