Если RAID5 / 6 рискован из-за URE, рискуют ли и схемы полного резервного копирования / восстановления?


11

Насколько я понимаю, у вас есть высокая вероятность встретить URE во время перестроения из-за необходимости читать большой объем данных для выполнения задачи.

Влияет ли эта проблема на сценарии резервного копирования и восстановления больших объемов данных? Если вам нужно сделать полное восстановление из резервной копии объемом 10 ТБ, URE кажутся такими же вероятными.


3
На самом деле это не проблема RAID6, а RAID не предназначен для резервного копирования, а предназначен для доступности.
user9517

Одной резервной копии недостаточно.
Восстановить Монику - М. Шредер

Ответы:


13

Настоящая проблема, связанная с URE и RAID5, заключается в том, что, запустив даже один URE, многие аппаратные контроллеры просто прерывают восстановление RAID и объявляют смерть массива, переводя все ваши данные в автономный режим. Хотя это «самая безопасная ставка» в отношении потенциального повреждения данных, это не всегда лучшее, что можно сделать (например: подумайте о URE, затрагивающем свободный / не распределенный по файловой системе сектор данных. Хотя это должно быть безопасно игнорировать это, аппаратный контроллер переведет весь массив в автономный режим).

RAID6 гораздо менее подвержен URE, поскольку избыточность двух дисков действительно снижает вероятность одновременных URE в одном и том же секторе диска / LBA.

В то же время программный RAID (например, mdadm), как правило, намного более гибок, чем аппаратный RAID, что позволяет восстанавливать поврежденный массив RAID5 даже при обнаружении некоторых URE.

Восстановление из резервной копии, как правило, имеет более гибкие инструменты; это означает, что в общем случае вы можете пропустить поврежденные / нечитаемые сектора и продолжить восстановление других данных.


3

Все на томе находится в опасности

Если вы заявляете, что у вас есть опасения относительно URE для тома / LUN, который пострадал из-за сбоя диска RAID 5/6, то все данные на этом томе будут подвержены риску.

Убедитесь, что вы храните свои данные на томе / LUN, отличном от того, на котором хранится резервная копия. В соответствии с рекомендациями ваша резервная копия находится на совершенно другом устройстве хранения, чем ваши производственные данные.

URE обычно находится на уровне блоков, поэтому все, что находится на этом томе, будет подвержено риску повреждения. Формат блочного уровня низок в стеке. NTFS или VMFS (любой формат) идет на уровне блоков и так далее. Поскольку уровень блока в томе RAID находится ниже всего, все данные, связанные с этим, связаны с проблемами на уровне блоков.

Я надеюсь, что я отвечаю на ваш вопрос правильно.


3

В принципе, да, но если вы сохраните свою резервную копию на RAID6 (в качестве примера), вы получите выгоду от избыточности, поэтому общая частота ошибок будет намного ниже, а вместе с ней и вероятность URE во время восстановления.

Если вы используете решение для резервного копирования на ленту, частота ошибок будет намного ниже (SAS: 1x10 ^ -15 - 1x10 ^ -16, LTO7: 1x10 ^ -19).

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.