В последнее время я столкнулся с некоторым простоем на некоторых сайтах Drupal, которые я развернул. Я хотел бы подходить к проблеме проактивно, а не реагировать на эти простои путем перезапуска служб или самого сервера. Я читал об инструментах мониторинга, таких как nagios, munin, cacti и т. Д., Для мониторинга работоспособности вашего сервера / инфраструктуры, но я на самом деле не пробовал их в работе. Я имею дело с Drupal почти в 99% случаев, и я хотел бы узнать предложения по мониторингу как на уровне сервера, так и на уровне Drupal (кода приложения).
По сути, я хотел бы получать уведомления, когда нагрузка на сервер высока, возможно, указав на виновника (или жертву), чтобы я мог принимать обоснованные решения. Я также хотел бы знать, что люди используют для мониторинга уровня Drupal (например, по электронной почте), когда есть ошибка / предупреждение PHP. (Что происходит, когда сам почтовый сервер не работает?)