Google провел очень тщательное исследование отказов жесткого диска, которое показало, что значительная часть жестких дисков выходит из строя в течение первых 3 месяцев интенсивного использования.
Мои коллеги и я думаем, что мы могли бы реализовать процесс записи всех новых жестких дисков, которые потенциально могут избавить нас от душевных страданий от потери времени на новых, непроверенных дисках. Но прежде, чем мы внедрим процесс выгорания, мы бы хотели получить представление от других, которые более опытны:
- Насколько важно записать на жесткий диск перед началом его использования?
- Как реализовать процесс выгорания?
- Как долго вы записываете на жесткий диск?
- Какое программное обеспечение вы используете для записи дисков?
- Сколько стресса слишком много для процесса выгорания?
РЕДАКТИРОВАТЬ: из-за характера бизнеса, RAID-массивы невозможно использовать большую часть времени. Нам приходится полагаться на отдельные диски, которые довольно часто рассылаются по всей стране. Мы выполняем резервное копирование дисков, как только можем, но мы все еще сталкиваемся с ошибками тут и там, прежде чем получаем возможность резервного копирования данных.
ОБНОВИТЬ
Моя компания уже давно внедрила процесс выгорания, и он оказался чрезвычайно полезным. Мы немедленно записываем все новые накопители, которые есть в наличии, что позволяет нам находить много ошибок до истечения срока гарантии и до их установки в новые компьютерные системы. Также оказалось полезным проверить, что диск вышел из строя. Когда один из наших компьютеров начинает сталкиваться с ошибками и основным подозреваемым является жесткий диск, мы повторно запустим процесс записи на этот диск и посмотрим на любые ошибки, чтобы убедиться, что диск действительно был проблемой, прежде чем запускать процесс RMA или выбрасывать это в мусорном ведре.
Наш процесс выгорания прост. У нас есть назначенная система Ubuntu с большим количеством портов SATA, и мы запускаем badblocks в режиме чтения / записи с 4 проходами на каждом диске. Чтобы упростить задачу, мы написали скрипт, который выводит предупреждение «ДАННЫЕ БУДУТ УДАЛЕНЫ ИЗ ВСЕХ ВАШИХ ДИСКОВ», а затем запускает блокировку ошибок на каждом диске, кроме системного.