Основная проблема здесь более фундаментальная; серверы в комнате потребляют определенное количество электричества, работают с ним и дают вам (вычислительный) результат ... а также отдают лишнее тепло.
Ваша проблема заключается в том, что, например, каждый сервер теряет 200btu во время работы (просто для выбора номера). У вас есть 6 серверов с выходной мощностью 200 БТЕ каждый, скажем, плюс сетевое оборудование ... вам нужно НЕОБХОДИМОЕ более 1200 БТЕ для охлаждения, чтобы его можно было охлаждать. Вы потеряете эффективность где-то. Пыль, вентиляция, что угодно, и у вас будут источники тепла, которые вы не учитывали, такие как флуоресцентные лампы и так далее.
Кондиционер охлаждается до 81F, потому что именно там система охлаждения, вероятно, сильно перегруженная, достигает нового равновесия с более горячей окружающей средой.
Если я подозреваю, что это перегрузка охлаждения, добавление другого сервера МОЖЕТ, скажем, поднять его всего на 5 градусов, но добавление секунды, вероятно, будет концом. Это достигло бы точки убегания, тогда менее эффективная электроника потратила бы еще больше тепла, поскольку они бежали сильнее ...
В этот момент у вас возникла ситуация, подобная моей компании (в серверной комнате с 300 серверами, насколько я помню!) ... серверы начали отключаться, когда достигли тепловых максимумов и отключений, при этом большинство остальных зависало. , Когда мы побежали, чтобы проверить комнату, «массовый провал» был на самом деле в комнате на 120F. Отслеживание процессора и температуры окружающей среды никогда не было для нас «чем-то особенным», поскольку «у нас было достаточно охлаждения» ... мы думали. Недавно мы добавили еще 25 единиц, и это было больше, чем могло выжить.
Интервалы могут изменить эффективность отвода тепла на самих серверах , но в комнате жарко просто потому, что тепло не удаляется из окружающей среды в целом. Более эффективный перенос тепла от А к В (от компьютера к комнате), не позволяющий В, в свою очередь, больше передавать С (от комнаты к зданию / зданию), в конечном итоге саморазрушителен.
Изменения TL; DR. Тепло, генерируемое путем преобразования электричества в веб-комиксы и сетевые ресурсы, должно быть надлежащим образом удалено охлаждающим устройством, что ему сейчас едва удается сделать. Добавить больше кондиционера, или да, удалить сервер или два.
В крайнем случае, включите управление питанием / управление процессором на серверах. Пусть они простаивают ЦП, пока он не используется максимально. Выключите мониторы, выключите верхние фонари ... также проверьте фильтр и катушки кондиционера, проверьте их на наличие пыли, что сделает его работу менее эффективной. Кроме того, вы можете отслеживать локальные температуры ядра процессора; 81F в этой комнате может указывать 140 на процессоре, или кто что знает. Это не хорошо, хотя.
(отредактировано для уточнения)