Как часто вы должны сканировать, зависит от многих вещей.
- Возраст дисков. Чем они старше, тем больше вероятность, что они будут содержать зло .
- Оригинальное качество дисков под вопросом. Материал, продаваемый как «предприятие», скорее всего, будет работать без ошибок, а диски 2014 года размером 1 + ТБ намного надежнее, чем их эквиваленты 2009 года, когда они поставлялись.
- Насколько чувствителен ваш производственный ввод / вывод к чистящему вводу / выводу.
- Какую часть вашего набора данных вы считаете своим рабочим набором.
По этой причине поставщики аппаратного RAID часто включают фоновый процесс очистки, некоторые даже позволяют вам настроить приоритет ввода / вывода процесса очистки, что позволяет избежать (или значительно уменьшить) производственные потери ввода / вывода для очистки. Конечно, если у вас низкий приоритет, и ваш ввод-вывод при работе с дисками в основном работает ровно, вы, вероятно, никогда не завершите очистку и даже не заметите ее, пока не получите ошибку.
К сожалению, я не знаю, удаляет ли ядро Linux процесс очистки ввода-вывода или нет. В любом случае, это хорошая идея, чтобы проверить это с нагрузками вашего продукта, чтобы убедиться, что любые потери производительности приемлемы. Если это приемлемо, хорошо! Если это не так, вы можете выбрать, добавлять ли шпиндели или нет, чтобы разрешить ввод-вывод scrub + prod или просто принять риск возможных сбоев массива в будущем.
Еще одна вещь, которая влияет на частоту очистки, это схема использования ввода / вывода. Если производственные нагрузки затрагивают только меньшинство дисков, единственным вводом / выводом, который обычно обнаруживает неисправный блок в незанятой части, будет ваш скраб; в этом случае вы хотите почистить чаще. Если ваши производственные нагрузки регулярно читают весь набор дисков (например, ежедневные полные резервные копии), то производственный ввод-вывод быстрее столкнется с проблемами, и вы сможете выполнять очистку реже.
Хороший план действий будет:
- Запустите несколько тестов, чтобы увидеть, будет ли очистка мешать производству.
- Выясните, сколько времени занимает полный скраб, пока вы на нем.
- Выясните, какой процент вашего дискового набора будет получать несколько обращений в течение данной недели (включите резервный ввод-вывод, если таковой имеется, в этот расчет).
- На основании 1 и 2 решите, будете ли вы в реже или чаще в лагере.
Как только у вас есть эти данные ...
- Если полное сканирование занимает менее суток и не оказывает заметного влияния на производство, вы можете ходить так часто, как раз в неделю.
- Если полное сканирование занимает менее суток и влияет на производительность, определите, какая часть вашей недели / месяца меньше всего затронуто, и попробуйте запустить его тогда.
- Если полное сканирование занимает более одного дня, но меньше недели и не влияет на производительность, запускайте его так же часто, как раз в две недели или раз в два месяца.
- Если полное сканирование занимает более одного дня, но меньше недели и влияет на производительность, рассмотрите возможность добавления ресурсов для его запуска, выполнения сканирования во время организованных периодов обслуживания или использования возможности очистки в режиме ожидания / проверки. это подходит и начинается непрерывно.
- Если полное сканирование занимает более недели, часто достаточно одного раза в месяц. Но если это влияет на производство, вам нужно будет добавить ресурсы для его завершения.