Существует низкая вероятность полного отказа шасси ...
Скорее всего, вы столкнетесь с проблемами на вашем предприятии, прежде чем выдержать полный отказ корпуса лезвия.
Мой опыт в первую очередь касается корпусов HP C7000 и HP C3000 . Я также управлял блейд-решениями Dell и Supermicro. Продавец имеет значение немного. Но в целом, оборудование HP было звездным, Dell был в порядке, а Supermicro не хватало качества, отказоустойчивости и было просто плохо спроектировано. У меня никогда не было сбоев на стороне HP и Dell. У Supermicro были серьезные перебои в работе, что заставило нас отказаться от платформы. На HP и Dells я никогда не сталкивался с полным отказом шасси.
- У меня были тепловые события. Неисправность кондиционирования воздуха на объекте совместного размещения отправила температуры до 115 ° F / 46 ° C в течение 10 часов.
- Скачки напряжения и сбои в линии: потеря одной стороны канала A / B. Индивидуальные сбои питания. Обычно в моих блейд-установках есть шесть блоков питания, поэтому есть много предупреждений и избыточности.
- Сбои отдельных блейд-серверов. Проблемы одного сервера не влияют на другие в корпусе.
- Огонь в шасси ...
Я видел множество сред и имел преимущество установки в идеальных условиях центра обработки данных, а также в некоторых более грубых местах. На стороне HP C7000 и C3000 главное, что следует учитывать, это то, что корпус полностью модульный. Компоненты спроектированы так, чтобы свести к минимуму влияние отказа компонента, влияющего на весь блок.
Подумайте об этом так ... Основное шасси C7000 состоит из передней, (пассивной) сборки объединительной платы и объединительной платы. Конструкционный корпус просто удерживает передний и задний компоненты вместе и выдерживает вес системы. Почти каждая часть может быть заменена ... поверьте, я много разобрал. Основные резервы - это вентилятор / охлаждение, питание и управление сетью. Процессоры управления ( встроенный администратор HP ) могут быть спарены для обеспечения избыточности, однако серверы могут работать без них.
Полностью заселенный корпус - вид спереди. Шесть блоков питания в нижней части работают на всю глубину корпуса и подключаются к модульной сборке объединительной платы в задней части корпуса. Режимы питания настраиваются: например, 3 + 3 или n + 1. Таким образом, корпус определенно имеет резервирование питания.
Полностью заселенный корпус - вид сзади. Сетевые модули Virtual Connect на задней панели имеют внутреннее перекрестное соединение, поэтому я могу потерять одну или другую сторону и при этом поддерживать сетевое подключение к серверам. Существует шесть источников питания с возможностью горячей замены и десять вентиляторов с возможностью горячей замены.
Пустой корпус - вид спереди. Обратите внимание, что в этой части корпуса нет ничего особенного. Все соединения передаются на модульную промежуточную плату.
Сборка средней плоскости снята. Обратите внимание на шесть блоков питания для сборки промежуточной платы внизу.
Сборка средней плоскости. Здесь происходит волшебство. Обратите внимание на 16 отдельных подключений на нижнем уровне: по одному для каждого блейд-сервера. У меня были отдельные серверные сокеты / отсеки, которые не разрушали весь корпус и не влияли на другие серверы.
Объединительная плата (ы) блока питания. Блок 3ø ниже стандартного однофазного модуля. Я изменил распределение питания в своем центре обработки данных и просто поменял объединительную плату блока питания, чтобы справиться с новым методом доставки энергии
Повреждение разъема шасси. Этот конкретный корпус был уронен во время сборки, оторвав контакты от разъема ленты. Это оставалось незамеченным в течение нескольких дней, в результате чего ходовое лезвие шасси ловило ОГОНЬ ...
Вот обугленные остатки ленточного кабеля промежуточной платы. Это контролировало некоторые температуры шасси и мониторинг окружающей среды. Блейд-серверы продолжали работать без инцидентов. Пострадавшие части были заменены на досуге во время запланированного простоя, и все было хорошо.