Хотя Munin и другие внешние интерфейсы RRDTool (такие как Cacti или Ganglia) являются отличными инструментами, они сталкиваются с проблемами ввода-вывода и их трудно масштабировать при мониторинге сотен узлов.
Есть несколько методов, чтобы справиться с этим узким местом ввода-вывода, хотя. Одним из таких методов является распределение записей по большому количеству дисков, чтобы уменьшить количество операций ввода-вывода на каждом диске. С другой стороны, многие системные администраторы используют файловые системы tmpfs для решения этой проблемы. RRDCached также является недавним и хорошим вариантом для решения этой проблемы, и я рекомендую вам взглянуть на эти слайды .
Я не очень знаком с Munin, но у Cacti есть плагин Boost . Этот плагин кэширует данные в памяти и выполняет массовые и по требованию обновления на диск вместо отдельных операций записи, тем самым сокращая число операций ввода-вывода. Я уверен, что у Мунина тоже есть что-то подобное.
Если вы можете себе это позволить, SSD-диски также являются хорошим вариантом.
И последнее, но не менее важное, вы также можете взглянуть на разведку . Recconoiter - это новый инструмент для обнаружения неисправностей и построения графиков / трендов. В отличие от большинства популярных инструментов, Reconnoiter не основан на RRDTool и пытается решить эту конкретную проблему. Я не использую Reconnoiter в производстве, но я провел несколько тестов и, несмотря на то, что все еще немного "зеленый", выглядит действительно многообещающе, особенно в отношении его масштабируемости.
Надеюсь это поможет!