Компьютеры гораздо лучше меня анализируют данные. Я лично предпочитаю такие системы, как OpsView, которые переваривают ситуации и предлагают многогранный интерфейс. Статистика мониторинга фильтруется на предмет ненормальных условий, а отдельные оповещения доставляются администраторам, ответственным за систему. Есть общая панель мониторинга состояния здоровья, которую могут просматривать службы поддержки и руководство, которые дают представление о том, насколько серьезен сбой и работает ли над ним кто-нибудь, кто может это исправить. Они вращают его на большом экране, как то, что вы можете увидеть с первого взгляда, а не как то, на что вы смотрите весь день. Прокрутка текста и мигающие огни - это не то, как наемные сотрудники должны взаимодействовать с вашими системами мониторинга.
У Конрада Альбрехта-Бюхлера есть Google Techtalk («Осуществление мониторинга - отстой»), в котором обсуждаются достоинства и недостатки, которые он видит в текущем дизайне пользовательского интерфейса приборной панели, и предлагаются некоторые улучшения. Я не знаю, опубликовал ли он код или даже свой тезис. Общая идея проста:
- Вы определяете мониторинг ситуации как захват набора сигналов о состоянии. Загрузка, свободное дисковое пространство, сетевой трафик или даже вещи более высокого уровня, такие как сообщения на форуме в час.
- Затем вы определяете функцию внимательности, которая отображает широкий входной сигнал от 0 до 1, где 0 означает «игнорировать», а 1 - «zomg!». В терминах Nagios он заменяет состояние WARNING целым числом WARNING.
- Наконец, вы определяете агрегатор для суммирования и расстановки приоритетов этих сигналов ПРЕДУПРЕЖДЕНИЕ.
Что касается конкретных инструментов, которые вы бы использовали для написания своей собственной системы мониторинга, у сценариев Nagios есть приличный интерфейс (возможно, именно здесь вы могли бы склеить отображение HEED, если оно вам нравится), сохранение сигналов можно выполнить с помощью rrdtool , и из этого вы можете сгенерировать графики, и есть приложение Django под названием Graphite, которое отображает базы данных rrd. Там также Нагвис :
NagVis - это надстройка для визуализации хорошо известной системы управления сетью Nagios.
NagVis можно использовать для визуализации данных Nagios, например, для отображения ИТ-процессов, таких как почтовая система или сетевая инфраструктура.