У меня печальный RAID-массив на карте 3ware 9650SE-16ML. Чего я не могу сказать, так это того, что у меня только что произошел сбой на двух дисках (облом!) Или я читаю это неправильно. Релейный выход /c0 show all
:
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 DEGRADED u0 931.51 GB 1953525168 5QJ07MAH
p1 ECC-ERROR u0 931.51 GB 1953525168 5QJ0DCW9
p2 OK u0 931.51 GB 1953525168 5QJ0DW9C
p3 OK u0 931.51 GB 1953525168 5QJ0CKXJ
И провал (от show alarms
):
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 [Sun Nov 20 07:47:23 2011] INFO Rebuild started: unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Drive ECC error reported: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Source drive error occurred: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Rebuild failed: unit=0
c0 [Sun Nov 20 08:20:12 2011] INFO Rebuild paused: unit=0
Я думаю , что произошел сбой p0, и затем p1 имел ошибку ECC (иначе мои данные пропали). Но ... может и нет? Он остается на 97% восстановленным, но не может обойти эту ошибку.
Насколько я могу судить, предыдущий админ отключил периодическую проверку, что и привело нас в это состояние. Это не то, о чем большинство людей должно беспокоиться с их RAID-массивами 3Ware!
Обновить
После нескольких дней, я сделал бит IgnoreECC, и он восстановился, но мои данные хранятся. Облом.