При установке munin активирует набор плагинов по умолчанию (по крайней мере, в Ubuntu). Кроме того, вы можете просто запустить, munin-node-configure
чтобы выяснить, какие плагины поддерживаются в вашей системе. Большинство из этих плагинов отображают прямые данные. Мой вопрос не в том, чтобы объяснить природу данных (ну ... может быть, для некоторых), но что вы ищете на этих графиках?
Легко установить munin и увидеть причудливые графики. Но наличие графиков и невозможность их «читать» делает их совершенно бесполезными.
Я собираюсь перечислить стандартные плагины, которые по умолчанию включены в моей системе. Так что это будет длинный список. Для полноты картины я также собираюсь перечислить плагины, которые, как мне кажется, понятны, и дать краткое объяснение того, для чего, я думаю, они используются. Пожалуйста, поправьте, если я ошибаюсь с любым из них.
Итак, позвольте мне разделить этот вопрос на три части:
- Плагины, где я даже не понимаю данные
- Плагины, где я понимаю данные, но не знаю, на что мне обратить внимание
- Плагины, которые я думаю, чтобы понять
Плагины, где я даже не понимаю данные
Они могут содержать вопросы, которые не обязательно направлены только на Мунина. Непонимание данных обычно означает пробел в фундаментальных знаниях об операционных системах / оборудовании ....;) Не стесняйтесь отвечать «giyf» ответом.
Это плагины, где я могу только догадываться, что происходит ... Я вряд ли хочу смотреть на эти "догадки" ...
- Дисковые операции
ввода-вывода на устройство (количество операций ввода-вывода в секунду) Что такое операции ввода-вывода. Я знаю, что это означает ввод / вывод. Но это так далеко. - Задержка диска на устройство (среднее ожидание ввода-вывода)
Не знаю, что такое ожидание ввода-вывода ... - Время обслуживания ввода-вывода
Это большой беспорядок, и почти невозможно что-либо увидеть на графике.
Плагины, где я понимаю данные, но не знаю, на что мне обратить внимание
- IOStat (блоки / секунду чтения / записи)
Я полагаю, что здесь нужно искать шипы? Что означало бы, что устройство интенсивно используется? - Доступная энтропия (байты)
Я предполагаю, что это важно для генерации случайных чисел? Зачем мне это график? До сих пор значение всегда было почти постоянным. - VMStat (запущенные / спящие процессы ввода / вывода) В
чем разница между этим и графиком «процессов»? Оба показывают запущенные / спящие процессы, тогда как граф «Процессы», кажется, содержит больше деталей. - Пропускная способность диска на устройство (байт / секунда чтения / записи) В
чем разница между этим и графиком «IOStat»? - Использование таблицы inode
Что я должен искать на этом графике?
Плагины, которые я думаю, чтобы понять
Я буду угадывать некоторые вещи здесь ... поправьте меня, если я ошибаюсь.
- Использование диска в процентах (процентах)
Сколько дискового пространства используется / осталось. Поскольку это приближается к 100%, вы должны рассмотреть возможность очистки или расширения раздела. Это чрезвычайно важно для корневого раздела. - Пропускная способность брандмауэра (пакетов в секунду)
Количество пакетов, проходящих через брандмауэр. Если это происходит в течение более длительного периода времени, это может быть признаком атаки DOS (или мы просто получаем большой файл). Он также может дать вам представление о производительности вашего брандмауэра. Если он выравнивается и вам нужно больше «мощности», вы должны рассмотреть распределение нагрузки. Если он выравнивается и видит корреляцию с загрузкой вашего процессора, это также может означать, что ваше оборудование недостаточно быстрое. Корреляции с использованием диска могут указывать на чрезмерные цели LOG в вашей конфигурации FW. - Ошибки eth0 (входящие / исходящие пакеты)
Сетевые ошибки. Если это значение увеличивается, это может быть признаком неисправного оборудования. - трафик eth0 (бит / сек. вход / выход)
Необработанный сетевой трафик. Это должно соответствовать пропускной способности брандмауэра. - количество потоков.
Постоянно увеличивающееся значение может указывать на процесс, который неправильно закрывает потоки. Исследовать! - процессы.
Нарушение активных процессов (в том числе спящих). Быстрый всплеск здесь может указывать на вилочную бомбу. Медленное, но постоянно растущее значение может указывать на то, что приложение порождает подпроцессы, но не закрывает их должным образом. Расследовать с помощьюps faux
. - Приоритет процесса
Показывает распределение приоритетов процесса. Наличие только высокоприоритетных процессов не очень полезно. Подумайте об отмене приоритетов некоторых. - Использование процессора
Довольно просто. Если это происходит, у вас может быть атака, или процесс загружает процессор. Если в обычных операциях он медленно увеличивается и приближается к максимальному, вам следует подумать об обновлении вашего оборудования (или распределении нагрузки). - использование таблицы файлов
Количество активно открытых файлов. Если это достигает максимума, вы можете открыть процесс, но не правильно выпустить файлы. - средняя загрузка
Показывает суммарное значение для нагрузки системы. Должно коррелировать с использованием процессора. Увеличение значений может происходить из ряда источников. Ищите корреляции с другими графиками. - использование памяти
Графическое представление вашей памяти. Пока у вас есть много неиспользованных + кеш + буферов, у вас все хорошо. - swap in / out
Показывает активность вашего раздела подкачки. Это всегда должно быть 0. Если вы видите активность на этом, вы должны добавить больше памяти на свой компьютер!