У меня никогда не было сбоев, которые я мог бы приписать цинку / олову, хотя мой набор образцов не огромен, и у меня никогда не было целого ряда сбоев электропитания, как вы описали, которые заставили бы меня охотиться за первопричина
Я бы посмотрел на более обычные проблемы (плохие конденсаторы в блоке питания или кратковременные электрические отказы, довольно высокие, особенно если учесть, что у вас было два "больших случая" отказов БП), хотя, похоже, у вас уже есть.
Мой короткий список на случай, если он отличается от вашего / вашего электрика:
Электрически: плохо стабилизированная мощность из-за неисправных ИБП или PDU / CDU, замыканий на землю и т. Д. Если ваши «крупные происшествия» были в районах, обслуживаемых одним и тем же оборудованием распределения энергии, это становится более вероятным.
Экологически: температура и влажность; Проверьте температуру на входе / выходе вашего оборудования (особенно, если сбои происходят в одной и той же физической зоне центра обработки данных: вы можете обнаружить проблему с воздушным потоком / охлаждением, из-за которой ваше оборудование нагревается).
Контроль качества оборудования / производителя: проверьте неработающие блоки питания на наличие выпирающих / перегоревших конденсаторов, особенно если неисправности происходят в устройствах, купленных примерно в одно и то же время. Убедитесь, что вы не слишком сильно толкаете блоки питания (большое количество жестких дисков и энергоемких процессоров может потребовать большего блока питания)