Эта проблема на самом деле связана с обнаружением пожара, но она сильно аналогична некоторым проблемам обнаружения радиоактивного распада. Наблюдаемые явления являются как спорадическими, так и сильно изменчивыми; таким образом, временной ряд будет состоять из длинных цепочек нулей, прерванных значениями переменных.
Цель - не просто захват событий (разрывы в нолях), но количественная характеристика самих событий. Однако датчики ограничены и, таким образом, иногда будут записывать ноль, даже если «реальность» не равна нулю. По этой причине при сравнении датчиков необходимо включать нули.
Датчик B может быть более чувствительным, чем Датчик A, и я хотел бы описать это статистически. Для этого анализа у меня нет «правды», но у меня есть датчик C, который не зависит от датчиков A и B. Таким образом, я ожидаю, что лучшее согласие между А / В и С указывает на лучшее согласие с «истиной». (Это может показаться шатким, но вам придется поверить мне - я здесь на твердом основании, основываясь на том, что известно из других исследований о датчиках).
Таким образом, проблема заключается в том, как количественно определить «лучшее согласование временных рядов». Корреляция является очевидным выбором, но на нее будут влиять все эти нули (которые нельзя исключить) и, конечно, непропорционально влияют максимальные значения. Среднеквадратичное отклонение также можно рассчитать, но оно будет сильно взвешено по отношению к поведению датчиков в случае, близком к нулю.
Q1: Каков наилучший способ применить логарифмическое масштабирование к ненулевым значениям, которые затем будут объединены с нулями в анализе временных рядов?
Q2: Какие «лучшие практики» вы можете порекомендовать для анализа временных рядов этого типа, где основное внимание уделяется поведению при ненулевых значениях, но преобладают нулевые значения и их нельзя исключать?