Какие ваши самые полезные / ценные плагины Nagios? [закрыто]


33

Мы расширяем нашу установку Nagios 3 и часто сталкиваемся с новыми NRPE или общими плагинами Nagios для тестирования нашей существующей инфраструктуры. Хотя это и дрянь, и было бы полезно получить сводку плагинов, которые пользователи Nagios больше всего ценят.

Пожалуйста, перечислите один плагин на пост, желательно с кратким описанием того, почему он вам нравится, и ссылку на MonitoringExchange или сайт разработчиков плагинов. Таким образом, люди могут голосовать за уже перечисленные плагины, и мы можем видеть их в порядке предпочтения.

По той же причине было бы лучше не перечислять плагины, которые уже упоминали другие. Если у вас есть что добавить в отношении плагина, который кто-то еще перечислил, оставьте комментарий к его ответу.

Благодарность!

Ответы:


8

С точки зрения гибкости, вы не можете победить плагин snmp. Он стоит за почти каждой проверкой, которую я запускаю, и если это не так, TCP-соединение есть.


snmp check выглядит довольно хорошо для фаворита на этом этапе Мэтта (и других :) - есть ли у вас какие-то специальные приемы, которые вы используете с ним? Моя главная претензия к net-snmpd на данный момент - это сложность «новой» функциональности «расширение, а не выполнение» - хорошо ли справляется check_snmpd?
Майк Паунтни

7

Наши самые полезные плагины - это те, которые проверяют нашу более высокую функциональность приложения. Например, у нас есть тесты, которые пытаются войти на веб-сайт, и тесты, которые пытаются отправить электронное письмо и проверить почтовый ящик pop3, чтобы убедиться, что он прибыл. Если что-то из этого сломается, мы можем использовать проверки более низкого уровня, чтобы увидеть, что не так. Pop3 мертв? МТА, МДА? Сервер базы данных? хранилище данных?


Wotcha Dave;) Есть ли у вас какие-либо советы о том, как вы соединяете проверки верхнего и нижнего уровня? Например, как вы создаете зависимость между отправкой электронной почты и установкой флажка pop3, чтобы увидеть его? Возможно ли сделать это исключительно через Nagios, или вы используете свою собственную логику?
Майк Паунтни

Вы действительно в 4 утра? :) У Nagios есть служебные зависимости, поэтому вы можете сделать проверку электронной почты зависимой от проверок smtp, MDA и POP3, но это просто означает, что проверка электронной почты не предупреждает, если какая-либо из проверок нижнего уровня делает. Это становится намного сложнее, если у вас есть кластер серверов, предоставляющих услугу, поскольку в nagios нет способа сказать «не предупреждайте нас об этой услуге, если все эти службы мертвы». Обычно мы просто полагаемся на знание того, как система объединяется, чтобы знать, где находятся проблемы.
Дэвид Пашли

7

Честно говоря, тот, который делает больше всего для меня, просто старый check_disk. Ничто не заставляет меня чувствовать себя настолько особенным, в том смысле, что «перестать есть пасту», как если бы вчера взорвался сервер, который работал нормально, бегал как сумасшедший, а потом узнал, что это потому, что я позволил дискам заполниться. Больше никогда в моей жизни не нужно делать это снова.

(И не забудьте также проверить иноды, дети смотрят дома.)


7

WebInject очень полезен для мониторинга веб-сайтов, если вы хотите выйти за пределы функциональности check_http; он может обрабатывать страницы входа и выполнять несколько шагов за одну проверку Nagios.


4

Я считаю, что check_nfsmount полезен на многих моих серверах.

Изменить: Я бы также проголосовал check_snmp, если бы у меня был представитель, чтобы сделать это. Он используется на всех моих серверах, плюс логика check_hpjd, которую я использую на всех своих принтерах HP.


4

Мой самый полезный - тот, который я написал сам, который проверяет сертификаты SSL на наших веб-серверах, чтобы я мог следить за истечением срока их действия.


Это опубликовано где-нибудь?
RainyRat

4
check_http -H www.verisign.com -C 14
wittwerch

4

PNP (pnp4nagios.org) - генерирует графики в стиле RRD для любой проверки Nagios, которая выводит perf. данные. Потрясающе полезный, особенно когда пытаешься убедить разработчиков в том, что этот недавно установленный сервис действительно является причиной всех этих скачков ЦП ...


3

check_nt (общение с NSClient или что-то похожее на эту тему) позволяет вам запрашивать WMI в окне Windows - если есть счетчик производительности, вы можете теперь отслеживать его с помощью Nagios.


И вы можете контролировать все ваши службы, которые работают, например, проверить, работает ли сервер exchange или sql
Simon Foster

2

Это немного постыдный плагин, но если вы отслеживаете машины Windows с помощью NRPE, NagiosPluginsNT, кажется, работает довольно хорошо. ;-)


2

Я бы согласился, что check_snmp - чрезвычайно ценный плагин; его можно использовать практически для любых целей, и все это отображается в SNMP. SNMP доступен в таких разных системах, как HP-UX, Tru64 и OpenVMS, без дополнительных установок.

Другой (не совсем) плагин, который очень полезен, это NagiosGrapher; У меня есть опыт в статье, которая объясняет больше, но также, чтобы другие могли использовать его без каких-либо трудностей, которые я испытал.

Один последний: NSCA. Вы можете написать скрипт на Perl, Ruby или ksh и передать результаты в NSCA.

Между гибкостью NSCA и SNMP в сочетании с отчетностью NagiosGrapher, это должно очень хорошо расширить ваш мониторинг.


2

Мне нравится check_http, чтобы проверить, что мои сайты все еще работают, я расширил его, чтобы убедиться, что на нем можно найти определенный текст, после того как однажды моя хостинговая компания решила обслуживать пустые страницы, и мои проверки nagios все прошли, поскольку сервер все еще работал.


2

Самым полезным для меня является тот, который я написал для своих нужд: nagios-check-webpage

Он загружает всю страницу с помощью js / css / images, с многопоточностью и gzip (за исключением большого количества полос), как настоящие навигаторы.


+1 Действительно, этот плагин потрясающий. Используя это для приложения. 4 месяца сейчас.
Хенк

1

Номер один - NagiosWSC. Позволяет осуществлять мониторинг агентов Windows без агента через WMI.


без агента, но с одной большой точкой отказа, тьфу.
Тото

1

Тот, который проверяет фактическую задержку при запуске веб-сайтов и сканирует ее на наличие скрытого тега «status: ok». Он обнаружил проблему с нашим кешем squid и проблему языкового набора, которая возникала только раз в несколько ночей в 3 часа ночи, когда кто-то заходил на сайт с браузером, который запрашивал интернациональную версию страницы на турецком языке.

Серьезно, настройте каждый тип мониторинга, какой только возможно. Странные ошибки и ошибки, которые вы можете обнаружить в сложной среде с хорошим мониторингом, просто удивительны. Кроме того, зарегистрируйте ваши данные о производительности в базе данных rrd и отобразите их в Cacti.


1

Одним из наиболее важных плагинов является тот, который я написал сам: check_rdiff_backup. Я делаю резервные копии за границей, и Нагиос говорит мне, если и когда что-то случится с ними.

Если вы ищете плагин rdiff-backup, есть один, который вы можете найти в Google.


1
Знаете ли вы один для rsnapshot?
Рори

1

check_curl для меня была находкой. Действительно отличался гибкостью при выполнении проверок веб-сайтов, а также обнаружил, что это намного проще, чем веб-инъекция, почти с той же функциональностью, которая мне нужна


1

Не просто плагин, но получение twurl ( https://github.com/marcel/twurl ) для работы в качестве средства отключения оповещений было абсолютной находкой. Нет необходимости в SMS-оповещениях и просто удовлетворении всех сторон.

Подробная информация о том, как это было сделано: оповещения Nagios с использованием твиттера (с twurl) не срабатывает - извиняюсь за бесстыдную саморекламу;)

Другие вещи...

Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) невероятно полезен в сочетании со стандартной проверкой загрузки ЦП и числа процессов при определении того, когда / если привязан ввод-вывод, и каким образом , Использование nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) делает это еще проще.


1

Ну, простые, простые и стандартные - check_disk, check_load, check_http достаточно хороши для большинства случаев (в основном мы хотим знать, работают ли серверы, сайты и так далее)

кроме check_disk и check_swap, есть check_memory http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/check_memory/details, который дает использование памяти ...




0

Это что-то вроде мошенничества, потому что я проделал большую разработку, и он на самом деле проверяет много разных вещей одновременно, но самый полезный для меня плагин nagios - Resmon . Это агент, который вы запускаете на самом сервере, и nagios подключается через http для выполнения проверок. Я предполагаю, что это похоже на то, что делает nrpe, но с рядом различных дизайнерских решений.


0

Я использовал два плагина. Один должен был предоставлять XML-поток предупреждений, а другой - отправлять уведомления через твиттер. Оба были полезны (кроме обычных плагинов). если вы считаете NRPE плагином, добавьте его тоже.


0

check_apt действительно крутой и напоминает мне об обновлении моих серверов Debian.


0

Недавно я начал использовать плагин check_multi , используя исправленную / улучшенную NRPE для больших выходных данных (из-за HTML и информации о производительности).
Это почти "один плагин, чтобы управлять ими всеми"! ;-)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.