Проверьте наличие ошибок жесткого диска / признаков отказа на CentOS Server


14

Какой лучший способ проверить наличие ошибок жесткого диска и ранних признаков сбоя в CentOS?


1
как часто должны проводиться проверки? ежедневно - еженедельно?
Инак

Ответы:


3

Я бы порекомендовал установить Smartmon ( http://sourceforge.net/apps/trac/smartmontools/wiki ) на ваш компьютер. Это программное обеспечение, которое может проверять состояние ваших дисков, в противном случае оно будет проверять / var / log / messages или / var / log / syslog для любых упоминаний об ошибках scsi


кажется, что smartmon, хотя в его статистике упоминается, что он будет отлавливать только 60% неисправных дисков ... если бы я настроил smartmon на ежедневное сканирование, помогло бы это быстрее умереть с жесткого диска - это seagate 7200.10?
Инак

@inac smartmon поможет hdds быстрее умереть? Где ты это прочитал? Пожалуйста, добавьте URL.
0:30

2
dmesg

Ядро будет регистрировать любые диагностические сообщения об устройствах ввода / вывода, поэтому вы можете проверить эти сообщения с помощью команды dmesg.


но вам придется запускать это вручную или cronjob dmesg dump в vi?
Инак

или. Вы можете создать скрипт, который будет выгружать его с помощью «dmesg> dmesg.dump.txt» и запускать его ежедневно с помощью cron.
Banjer

1

Вы можете запустить fsck на устройстве, чтобы проверить наличие ошибок.


0

Как говорит Пол, журналы SMART - хорошее место для проверки.

Я также рекомендовал бы запускать BadBlocks . Если у вас есть карта RAID, вам, возможно, придется использовать мониторинг на этом.


0

SMART-мониторинг - это хороший способ. В качестве пользователя root, smartctl -a /dev/hdaгде hda - это нужный вам диск ... это может быть hdb, sda и т. Д. Также рекомендуется указать свой адрес электронной почты в / etc / aliases как лицо, которое должно получать почту root.

Это очень расплывчатый ответ. Если у вас есть сервер от одного из крупных производителей (Dell, HP и т. Д.), Скорее всего, есть лучшие возможности мониторинга.


0

Вы можете попробовать полную проверку раздела / dev / sda1 (например) как

fsck -f /dev/sda1

или, попробуйте полный неразборчивый тест записи-чтения данного раздела

badblocks -vn /dev/sda1

/dev/sda1 is mounted; it's not safe to run badblocks!
0:30

e2fsck: Cannot continue, aborting.
0:30

@ 030 Перейдите на уровень выполнения, где основной диск не смонтирован.
awiebe
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.