Хотя это старый пост, отвечая сейчас, потому что я знал, что пороговые значения check_load - головная боль для новичков ..;)
Предупреждающее предупреждение, если ЦП составляет 70% в течение 5 минут, 60% в течение 10 минут, 50% в течение 15 минут. Критическое предупреждение, если ЦП составляет 90% в течение 5 минут, 80% в течение 10 минут, 70% в течение 15 минут.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Все мои выводы о загрузке процессора:
Что означает «нагрузка»: Википедия говорит:
Все Unix и Unix-подобные системы генерируют метрику из трех «средних значений загрузки» в ядре. Пользователи могут легко запросить текущий результат из оболочки Unix, выполнив команду uptime:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
Из вышеприведенного среднего значения выходной нагрузки: 0.06, 0.11, 0.09
означает (в однопроцессорной системе):
- в последнюю минуту процессор был недогружен на 6%
- в течение последних 5 минут, процессор был недогружен на 11%
- в течение последних 15 минут процессор был загружен на 9%
,
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
Приведенное выше среднее значение нагрузки в 1.73 0.50 7.98
системе с одним ЦП как:
- в последнюю минуту ЦП был перегружен на 73% (1 ЦП с 1,73 запускаемыми процессами, поэтому 0,73 процесса пришлось ждать очереди)
- в течение последних 5 минут процессор был недогружен на 50% (никакие процессы не должны были ждать поворота)
- в течение последних 15 минут ЦП был перегружен на 698% (1 ЦП с 7,98 работающими процессами, поэтому 6,98 процессам приходилось ждать очереди)
Расчет порогового значения Nagios:
Для настройки загрузки процессора Nagios, которая включает в себя предупреждение и критическое:
y = c * p / 100
Где:
y = nagios value
c = number of cores
p = wanted load procent
для 4-х ядерной системы:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Для одноядерной системы:
y = p / 100
Где:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Отличный документ об анализе загрузки процессора, написанный д-ром Гюнтером http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
В этой онлайн-статье д-р Гюнтер исследует ядро UNIX, чтобы узнать, как средняя нагрузка ( «Тройки Лос-Анджелеса») рассчитываются и насколько они подходят в качестве метрик планирования емкости.
standard
илиtested
ценность. Это зависит от вашей ожидаемой нагрузки на сервер. Если вы ожидаете высокую нагрузку, вы должны увеличить значения. В противном случае ваш сервер всегда будет в критическом состоянии.