Анализ взаимной корреляции между точечными процессами


15

Я хотел бы получить совет относительно метода анализа, который я использую, чтобы узнать, является ли он статистически обоснованным.

Я измерил две точки процессы и Т 2 = т 2 1 , т 2 2 , . , , , t 2 m, и я хочу определить, связаны ли события в T 1 с событиями в T 2 .T1знак равноT11,T21,,,,,TN1T2знак равноT12,T22,,,,,Tм2T1T2

Одним из методов, которые я нашел в литературе, является метод построения гистограммы взаимной корреляции: для каждого мы находим задержку для всех событий T 2, которые выпадают в данном окне времени (до и после t 1 п ), а затем мы строим гистограмму всех этих задержек.TN1T2TN1

Если бы эти два процесса не коррелировали, я бы ожидал плоскую гистограмму, так как вероятность наличия события в после (или до) события в T 1 одинакова при всех задержках. С другой стороны, если на гистограмме есть пик, это говорит о том, что двухточечный процесс как-то влияет друг на друга (или, по крайней мере, имеет некоторый общий вход).T2T1

Теперь, это хорошо и хорошо, но как мне определить, имеют ли гистограммы пик (я должен сказать, что для моего конкретного набора данных они явно плоские, но все же было бы неплохо иметь статистический способ подтверждая это)?

T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

T2*T1

T2*T1

Затем я взял бы это значение 95% для всех временных задержек и использовал бы его в качестве некоторого «предела достоверности» (возможно, это не правильный термин), так что все, что превышает этот предел в исходной гистограмме, можно считать «истинным» вершина горы".

Вопрос 1 : является ли этот метод статистически корректным? Если нет, то как бы вы решили эту проблему?

Вопрос 2 : еще одна вещь, которую я хочу увидеть, есть ли «более длинный» тип корреляции моих данных. Например, могут быть похожие изменения в скорости событий в двухточечных процессах (обратите внимание, что они могут иметь совершенно разные скорости), но я не уверен, как это сделать. Я подумал о создании «огибающей» каждого точечного процесса с использованием некоторого сглаживающего ядра, а затем выполнил кросс-корреляционный анализ двух огибающих. Не могли бы вы предложить другой возможный тип анализа?

Спасибо и извините за этот очень длинный вопрос.

Ответы:


11

Стандартный метод для анализа этой проблемы в двух или более измерениях - это K-функция Рипли (перекрестная) , но нет никаких оснований не использовать ее и в одном измерении. (Поиск Google хорошо справляется с поиском ссылок.) По сути, он отображает CDF всех расстояний между точками в двух реализациях, а не приближение гистограммы к PDF этих расстояний. (Вариант, функция L, отображает разницу между K и нулевым распределением для двух однородных некоррелированных процессов.) Это аккуратно обходит большинство проблем, с которыми вы сталкиваетесь, - необходимость выбора корзин, сглаживания и т. Д. Полосы доверия для K как правило, создаются с помощью моделирования. Это легко сделать в R. Многие пакеты пространственной статистики для R можно использовать напрямую или легко адаптировать к этому 1D случаю. Роджер БивандНа странице обзора в CRAN перечислены эти пакеты: обратитесь к разделу «Анализ точечного рисунка».


Интересно ... Я немного занят в данный момент, но я обязательно посмотрю на это!
Нико
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.