Я пишу сценарий, который анализирует время выполнения процессов. Я не уверен в их распространении, но хочу знать, выполняется ли процесс «слишком долго». До сих пор я использовал 3 стандартных отклонения времени последнего запуска (n> 30), но мне сказали, что это не дает ничего полезного, если данные не являются нормальными (что, похоже, не так). Я нашел другой тест на выбросы, в котором говорится:
Найти межквартильный диапазон, который равен IQR = Q3 - Q1, где Q3 - третий квартиль, а Q1 - первый квартиль. Затем найдите эти два числа:
а) Q1 - 1,5 * IQR b) Q3 + 1,5 * IQR
Точка является выбросом, если <a или> b
Мои данные обычно бывают такими, как 2 с, 3 с, 2 с, 5 с, 300 с, 4 с, .... где 300 с, очевидно, являются выбросом.
Какой метод лучше? Метод IQR или метод стандартного отклонения?