Общее мнение, как представляется, заключается в том, что ответ на ваш вопрос состоит из двух частей:
Как мы можем найти источник смешного горящего запаха?
У вас есть «Как», довольно хорошо прибитый:
- «Тест на нюх»
- Ищите видимый дым / дымку
- Пройдите по комнате с тепловой (ИК) камерой, чтобы найти горячие точки
- Проверьте панели мониторинга и устройства на наличие предупреждений
Вы можете повысить свои шансы на быстрое обнаружение проблемы несколькими способами - улучшение мониторинга часто является самым простым. Некоторые вопросы, чтобы задать:
- Получаете ли вы температуру и другие предупреждения о вреде для здоровья от вашего оборудования?
- Ваши системы ИБП сообщают о сбоях в вашу систему мониторинга?
- Получаете ли вы сигналы тревоги по току от вашего распределительного оборудования?
- Отвечают ли детекторы комнатного дыма системе мониторинга? (а они могут? )
Когда мы должны устранять неполадки, а не нажимать на большой красный выключатель?
Это более интересный вопрос.
Нажав на большой красный выключатель, вы можете потратить на спешку огромные деньги вашей компании: чистые выпуски агента могут составлять десятки тысяч долларов, а затраты на отключение / восстановление после аварийного отключения питания (EPO, «бросая комнату») ) может быть разрушительным.
Вы не хотите бросать центр обработки данных, потому что конденсатор в источнике питания лопнул и заставил комнату пахнуть.
И наоборот, пожар в серверной комнате может стоить вашей компании данных / оборудования и, что более важно, жизни ваших сотрудников.
Устранение неполадок, связанных с «странным жгучим запахом», никогда не должно иметь приоритет над безопасностью , поэтому важно иметь некоторые четкие правила для устранения неполадок в условиях «предпускового подогрева».
Следующие рекомендации являются моими личными ограничениями, которые я применяю в отсутствие (или в дополнение к) любых других четко определенных процедур / правил - они хорошо мне помогли и могут помочь вам, но они могут так же легко убить меня или уволен завтра, так что применяйте их на свой страх и риск.
Если вы видите дым или огонь, бросьте комнату.
Это должно быть само собой разумеющимся, но давайте все равно скажем: если есть активный огонь (или дым, указывающий на то, что это скоро произойдет), вы покидаете комнату, отключаете питание и разряжаете огонь. система подавления.
Исключения могут существовать (проявлять здравый смысл), но это почти всегда правильное действие.
Если вы продолжаете устранять неполадки, всегда привлекайте хотя бы еще одного человека.
Это по двум причинам. Во-первых, вы не хотите бродить в центре обработки данных, и вдруг у вас поднимется стойка в ряду, по которому вы идете, и никто не знает, что вы там. Во-вторых, другой человек - это ваша проверка в здравом уме при устранении неполадок, а не увольнение из комнаты, и если вы позвоните в «Большой красный выключатель», у вас будет преимущество, если второй человек согласится с решением (помогает избежать аспектов, ограничивающих карьеру) о таком решении, если кто-то подвергает сомнению это позже).
При устранении неполадок соблюдайте меры предосторожности.
Убедитесь, что у вас всегда есть запасной выход (открытый конец ряда и свободный путь к выходу).
Держите кого-то, размещенного в EPO / выпуске подавления огня.
Возьмите с собой огнетушитель (галон или другое чистящее средство, пожалуйста).
Помните правило № 1 выше.
Если сомневаетесь, покиньте комнату . Позаботьтесь о своем дыхании: используйте респиратор или кислородную маску. Это может спасти ваше здоровье в случае химического пожара.
Установите предел и придерживайтесь его.
Точнее, установите два ограничения:
- Условие («Насколько хуже я позволю этому получить?»), И
- Время («Как долго я буду пытаться найти проблему, пока она не стала слишком рискованной?»).
Установленные вами лимиты также можно использовать, чтобы позволить вашей команде начать упорядоченное отключение затронутой области, поэтому, когда вы ДЕЛАЕТЕ питание, вы не разбиваете кучу активных машин, и ваше время восстановления будет намного короче, но помните, что если корректное отключение занимает слишком много времени, возможно, вам придется разрешить сбой нескольким системам во имя безопасности.
Доверяйте своей интуиции
Если вы в любое время беспокоитесь о безопасности, отключите поиск неисправностей и очистите комнату.
Вы можете или не можете бросить комнату, основываясь на чувстве кишки, но разумно перегруппироваться за пределами комнаты в (относительной) безопасности.
Если нет непосредственной опасности, вы можете взять с собой в местное отделение пожарной охраны, прежде чем предпринимать какие-либо радикальные действия, такие как выброс EPO или чистящего средства. (Они могут попросить вас сделать это в любом случае: их задача - защищать людей, а затем имущество, но они, очевидно, являются экспертами в борьбе с пожарами, поэтому вы должны делать то, что они говорят!)
Мы обсуждали это в комментариях, но это также может быть обобщено в ответе - @DeerHunter, @Chris, @Sirex и многие другие участвовали в обсуждении.