Я работаю над системой на базе SUSE Linux, которая работает 24/7 и работает около 3 лет, хотя я не могу сказать, что она не была перезагружена за это время.
9 июня, по-видимому, произошло какое-то закрытие сайта, но я не знаю, как это происходило.
С тех пор произошли бесчисленные мгновенные перезагрузки.
Неисправность возникла практически при любой мыслимой ситуации испытания, например Пользовательские приложения работают или нет, архивируют данные или нет, записывают новые данные или нет, запускают fsck после 20 или более сбоев или просто ничего не делают.
Оперативная память была заменена.
Вентилятор охлаждения на радиаторе процессора был заменен, так как он был довольно шумным (хотя через него дул более мощный вентилятор, всего в 20 мм).
Блок питания был заменен, а зеленый провод заземлен, чтобы предотвратить его отключение.
Похоже, что это приводит к тому, что перезагрузки происходят немного реже.
Видимо, хотя я этого не делал, на нем был запущен fsck [вероятно] [диск на 250 ГБ имеет раздел данных размером около 220 ГБ], но я не знаю, были ли проверены все разделы. Но он, по-видимому, работает непрерывно в течение 2 дней.
Кто-нибудь может подсказать, какие проблемы могут привести к тому, что Linux мгновенно умрет и перезагрузится?