У нас есть сервер Graphite для сбора данных с помощью collectd, statsd, JMXTrans ... Уже несколько дней у нас часто возникают дыры в наших данных. Перебирая данные, которые у нас еще есть, мы видим увеличение размера углеродного кэша (с 50К до 4М). Мы не видим увеличения количества собранных метрик (metricsReceived стабилен на отметке 300K). Мы имеем увеличение количества запросов в среднем с 1000 до 1500.
Как ни странно, cpuUsage немного уменьшается со 100% (у нас 4 процессора) до 50% при увеличении размера кеша.
Как ни странно, мы видим увеличение количества считанных октетов с диска и уменьшение количества записанных октетов.
У нас есть углеродная конфигурация в основном со значениями по умолчанию:
- MAX_CACHE_SIZE = inf
- MAX_UPDATES_PER_SECOND = 5000
- MAX_CREATES_PER_MINUTE = 2000
Очевидно, что что-то изменилось в нашей системе, но мы не понимаем, что и как мы можем найти эту причину ...
Любая помощь ?