Я пытаюсь автоматизировать обнаружение выбросов во временных рядах, и я использовал модификацию решения, предложенного здесь Робом Хиндманом .
Скажем, я измеряю ежедневные посещения сайта из разных стран. В некоторых странах, где ежедневные посещения составляют несколько сотен или тысяч, мой метод, кажется, работает разумно.
Однако в тех случаях, когда страна ведет к 1 или 2 визитам в день, ограничения алгоритма очень узки (например, 1 ± 0,001), и поэтому 2 посещения считаются выбросами. Как я могу автоматически обнаруживать такие случаи и как я могу лечить их, чтобы идентифицировать выбросы? Я не хотел бы устанавливать ручной порог, скажем, 100 посещений в день.
Спасибо!