Я провел некоторые исследования nagios, opennms и zenoss, но не уверен, что нашел то, что искал.
Главная движущая сила для меня сейчас - возможность контролировать резервные копии. Это включает в себя mysql, mssql и, в конечном итоге, некоторые резервные копии файловой системы.
У нас есть инструмент, который оборачивает процесс резервного копирования для этих различных систем и собирает статистику. Итак, такие предметы, как:
- количество резервных копий баз данных
- размер файла резервной копии в дБ
- размер сжатого файла резервной копии в дБ
- время сделать резервную копию
- время архивировать файл
Я хочу иметь возможность A) иметь уведомления, если задания не выполняются в соответствии с расписанием B) иметь возможность устанавливать пороговые значения для статистики, которые будут вызывать уведомления C) Я хочу иметь возможность отслеживать и составлять график статистики
Я планирую отправить эту информацию в приложение мониторинга через HTTP POST. Или приложение мониторинга может также извлечь его из файла журнала.
Тем не менее, у нас будут другие процессы с другой «произвольной» (с точки зрения системы мониторинга) статикой, которую нужно отслеживать и отслеживать, поэтому гибкость очень важна.
Инструмент или инструменты также должны иметь возможность осуществлять общий мониторинг и отслеживание сетевых интерфейсов, нагрузки на сервер и т. Д. После того, как мы запустим мониторинг резервного копирования, мы захотим включить и эти элементы.
Спасибо.
Продолжение :
Я решил попробовать следующее в данном порядке:
- Zabbix: казался скорее «универсальным магазином», чем другие, и его было легко установить в Ubuntu Lucid RC
- opsview
- Nagios с Nagvis, pnp4nagios, nagiosgraph
- плагин cacti w / npc
- Мунин: немного шрамы от простоты, но это может оказаться благословением в долгосрочной перспективе
Отправлю ответ, как только я приму решение, может пройти некоторое время, пока это не произойдет.