Я ищу способ диагностики проблем, таких как смерть подкачки, при которой вздувающийся процесс памяти заполняет подкачку и убивает всю машину (например, apache).
Я уже использую cacti, и я могу настроить nagios (хотя и не очень) или munin, но, насколько я могу судить, они не могут записывать использование отдельных программ - только общий статус.
Я знаю, что могу бросать скрипт, который >> в какой-то файл, каждые 30 с, но я хотел бы посмотреть, существует ли уже существующее зрелое решение.
Опять же, в идеале это будет:
- записывать использование памяти процессами каждые N секунд
- записывать использование процессора процессами каждые N секунд
- графики поддержки и история
- средние значения поддержки - как, например, mysqld использовал 43% ЦП в последний день и в среднем 400 МБ памяти
- быть свободным и открытым исходным кодом
Имена процессов не известны и не должны быть известны заранее. Идея состоит в том, чтобы просто позволить ему отслеживать, а затем взглянуть на главных нарушителей.
Моя система Linux (OpenSUSE).