Точка текущих / наихудших атрибутов, таких как температура, как раз и заключается в следующем: сообщать вам, когда накопитель когда-либо находился за пределами своей максимальной рабочей температуры и, следовательно, мог получить постоянное повреждение.
Вот почему в нем говорится «провалился в прошлом», а не «провалился сейчас»: вы едва коснулись порога максимальной температуры. Обратите внимание, что на дисплее атрибута отображается «нормализовано: 50, порог: 45, худшее: 45». (Это нормализованные значения 0..200, как для любого другого атрибута, а не сырые температуры по Цельсию.)
У вас также есть несколько поврежденных секторов (неисправимые ошибки секторов), поэтому, независимо от того, из-за короткой высокой температуры это или нет, возможно, пришло время отключить этот диск.
Лучший пользовательский интерфейс программного обеспечения SMART покажет вам текущую и максимальную температуру . например,
smartctl -a /dev/sda
или smartctl -x /dev/sda
( -x
печатает все доступные SMART и не SMART данные, которые он может получить от привода, включая журнал истории температур, если он есть, с гистограммой ASCII.)
Smartctl -x включает это для старого жесткого диска WD Green 1 ТБ (WD10EADS):
Current Temperature: 36 Celsius
Power Cycle Min/Max Temperature: 25/42 Celsius
Lifetime Min/Max Temperature: 35/46 Celsius
Программное обеспечение, которое вы используете, похоже, показывает только текущую температуру, которая немного ниже порогового значения, но не собирается скрывать тот факт, что накопитель был некондиционным в некоторый момент в прошлом.
Вы, безусловно, можете оправдать игнорирование этой кратковременной высокой температуры, если вы действительно исправили ее за считанные минуты. Но вы никогда не сможете (или не должны) заставить сам диск лгать о том, что он какое-то время превышал его номинальную максимальную температуру, и, таким образом, атрибут не удался в прошлом.
Вы можете настроить smartd
игнорирование любого заданного атрибута, чтобы вы могли получать полезные уведомления, если что - либо еще пересекает порог на официально проваливающейся территории. : smartd.conf(5)
Говорит:
-i ID [ATA only]
Игнорировать идентификатор номера атрибута устройства при проверке сбоя атрибутов использования. ID должен быть десятичным целым числом в диапазоне от 1 до 255. Эта директива изменяет поведение директивы '-f' и без нее не действует.
Это полезно, например, если у вас очень старый диск и вы не хотите получать сообщения о сбоях атрибута продолжительности жизни (обычно атрибута 9). Эта директива может появляться несколько раз для одного устройства, если вы хотите игнорировать несколько атрибутов.
Расширенные атрибуты истории температуры
Я только что получил новую 6 ТБ Seagate Barracuda (ST6000DM003-2CY186 с прошивкой 0001, привод 5425 об / мин), в которой есть некоторые интересные характеристики, включая время, потраченное на превышение минимальных / максимальных рабочих точек, а также высокий / низкий кратковременные и кратковременные временные температуры ,
SCT Status Version: 3
SCT Version (vendor specific): 522 (0x020a)
Device State: Active (0)
Current Temperature: 33 Celsius
Power Cycle Min/Max Temperature: 27/33 Celsius
Lifetime Min/Max Temperature: 27/33 Celsius
Under/Over Temperature Limit Count: 0/0
SCT Temperature History Version: 2
Temperature Sampling Period: 3 minutes
Temperature Logging Interval: 59 minutes
Min/Max recommended Temperature: 14/55 Celsius
Min/Max Temperature Limit: 10/60 Celsius
Temperature History Size (Index): 128 (2)
И в подробном разделе:
0x05 ===== = = === == Temperature Statistics (rev 1) ==
0x05 0x008 1 33 --- Current Temperature
0x05 0x010 1 - --- Average Short Term Temperature
0x05 0x018 1 - --- Average Long Term Temperature
0x05 0x020 1 33 --- Highest Temperature
0x05 0x028 1 30 --- Lowest Temperature
0x05 0x030 1 - --- Highest Average Short Term Temperature
0x05 0x038 1 - --- Lowest Average Short Term Temperature
0x05 0x040 1 - --- Highest Average Long Term Temperature
0x05 0x048 1 - --- Lowest Average Long Term Temperature
0x05 0x050 4 0 --- Time in Over-Temperature
0x05 0x058 1 55 --- Specified Maximum Operating Temperature
0x05 0x060 4 0 --- Time in Under-Temperature
0x05 0x068 1 13 --- Specified Minimum Operating Temperature
(Диск был включен только на пару минут; возможно, поэтому -
в некоторых полях данные отсутствуют).
Если у вашего привода есть эти расширенные атрибуты, вы можете показать кому-то, что время, проведенное за пределами допустимой температуры, было очень коротким (если это так). Предположительно, если бы вы собирались изменить данные SMART, вы бы просто сделали это и удалили все упоминания о том, что они вне диапазона, но, очевидно, вы не можете на 100% доверять любым данным с подержанного диска, который кто-то пытается продать тебя.
См. Https://superuser.com/questions/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist для получения дополнительной информации об используемых дисках с например, «откат одометра» в их атрибуте «Power_On_Hours».