Я использую довольно большую конфигурацию nagios (около 4000 сервисов), без каких-либо зависимостей. Это приводит к огромному беспорядку уведомлений, когда что-то идет не так.
Я пытаюсь найти лучшие практики с помощью Nagios Dependencies, но все, что я нахожу в Интернете, - это базовое понимание на одном примере. Что мне нужно, так это более глубокая информация, рекомендации по управлению таким файлом конфигурации.
Пример: на кластере из 100 серверов с прослушиванием apache на каждом я наблюдаю за количеством процессов apache и прослушивающим tcp-портом 80. Я хочу, чтобы один зависел от другого, но variable_hostgroup_name не справится с задачей, так как в результате все службы «процесса проверки» зависят от каждой службы «check_http».
Вопросы: Как вы управляете своими зависимостями? Используете ли вы сценарии для их создания?