Должен ли я использовать «Рейд 5 + запасной» или «Рейд 6»?


12

Что такое «Raid 5 + Spare» (выдержка из Руководства пользователя, раздел 4.17.2, стр.54 ):

RAID5 + Spare: RAID 5 + Spare - это массив RAID 5, в котором один диск используется как запасной для восстановления системы в случае сбоя диска (Рис. 79). Требуется как минимум четыре диска. В случае сбоя одного физического диска данные остаются доступными, поскольку они считываются из блоков четности. Данные с неисправного диска перестраиваются на диск горячего резервирования. При замене неисправного диска замена становится новым горячим резервом. Данные не будут потеряны в случае сбоя одного диска, но если произойдет сбой второго диска до того, как система сможет восстановить данные в «горячий» резерв, все данные в массиве будут потеряны.


Что такое «Raid 6» (выдержка из Руководства пользователя, раздел 4.17.2, стр.54 ):

RAID6: в RAID 6 данные распределяются по всем дискам (минимум четыре), и два блока контроля четности для каждого блока данных (p и q на рис. 80) записываются на одной полосе. В случае сбоя одного физического диска данные с неисправного диска могут быть восстановлены на диск для замены. Этот режим Raid может поддерживать до двух сбоев диска без потери данных. RAID 6 обеспечивает более быстрое восстановление данных с неисправного диска.


И «Рейд 5 + запасной» и «Рейд 6» НАСТОЛЬКО похожи ... Я не могу сказать разницу.

Когда «Рейд 5 + Запас» будет оптимальным?

И когда «Рейд 6» будет оптимальным?

Руководство озвучивает различные рейды с рейтингом 5 звезд. «Рейд 5 + Запас» получает только 4 звезды, а «Рейд 6» получает 5 звезд. Если бы я слепо доверял руководству, я бы сделал вывод, что «Рейд 6» всегда лучше. «Рейд 6» всегда лучше?


1
ServerFault имеет хорошее обсуждение по этому вопросу.
Брайан

1
Что бы вы в итоге ни делали, совершайте набеги только с помощью raid-контроллера, а не со встроенным программным контроллером, который поставляется вместе с mobo. Если ваш мобо гаснет, вы напрашиваетесь на неприятности.
sound2man

Рейд сбит аппаратным контроллером (смеюсь, я слышал слишком много о программных рейд-контроллерах).
Тревор Бойд Смит

Ответы:


17

Короче говоря:

  • Если безопасность - ваша главная задача, тогда используйте RAID6, поскольку он может выдержать любые два диска, выходящие из строя одновременно. Если в отказоустойчивом устройстве R5 + происходит сбой диска, вы не защищены от другого сбоя, пока запасной не будет доведен до скорости, которая может занять довольно много времени на больших дисках (и это не случайно для диска, который был выключен). целую вечность, такую ​​как ваш запасной, чтобы не раскручиваться, когда наконец призван).

  • Если производительность на первом месте, используйте 5+ запасных, поскольку производительность записи будет выше, если массив не находится в ухудшенном состоянии - хотя разница в производительности между R5 и R6 значительно меньше, чем разница между R5 и другими решениями, если у вас есть хороший контроллер (т. е. когда он выполняет операцию частичной записи блока "два / три одновременных чтения, затем вычисление четности, затем две / три одновременных записи" большую часть времени, а не "чтение-затем-чтение (-then-read) -then-parity" -calc-then-write-then-write (-then-write) ", что могут сделать некоторые очень дешевые контроллеры и программный RAID.

Изменить: я пропустил потенциально важный момент в первый раз:

  • Если энергопотребление вызывает беспокойство, то запасной R5 + будет иметь дополнительное преимущество, если ваш контроллер отключит запасной диск до тех пор, пока он не понадобится.

Наиболее хорошо написано / сжато. (Сформулируйте очевидные плюсы / минусы в первых двух словах каждого пункта маркированного списка ... очень, очень хорошо).
Тревор Бойд Смит

Мне было бы любопытно узнать, когда, если вообще когда-либо, потребление энергии одного дополнительного диска действительно будет «проблемой» по сравнению со всем остальным в центре обработки данных / серверной комнате / и т. Д.
Уоррен

Один диск в одной машине, вероятно, нет. Но в обычной ситуации, когда вы получаете X-amps-per-rack и платите много за любое превышение (или превышение просто не разрешено - иногда, если вы идете слишком долго, вы темнете), это может быть заметно. Мощность «потребляемая» - тоже двойной удар: она преобразуется в шум и тепло, и вам в конечном итоге понадобится больше энергии для отвода тепла. И для целой клетки или большего набора комплектов общее потребление дополнительного диска на вычислительную единицу скоро складывается в то, что мог заметить достаточно требовательный бухгалтер.
Дэвид Спиллетт

7

RAID 5 + горячее резервирование:

  • на равном оборудовании контроллера лучшая производительность, чем у RAID 6
  • Вы не можете потерять 2 диска одновременно . когда вы теряете диск, есть время восстановления (с горячим резервом), когда у вас нет избыточности . Все, что терпит неудачу в это время, приводит к полной потере (если не посылать что-либо хорошей фирме по спасению данных и платить действительно $$$$)

RAID 6:

  • худшая производительность, чем у RAID 5 (в зависимости от контроллера она может варьироваться от очень заметной до практически никакой разницы)
  • Вы можете потерять 2 диска одновременно

Для любого RAID 5 или 6 вы должны быть осторожны, чтобы использовать диски, которые не из того же производственного цикла. Может случиться (я видел это!), Что после одного сбоя при восстановлении следующего диска (ов) происходит сбой из-за повышенного напряжения. Диски из того же цикла имеют точно такую ​​же прошивку и, вероятно, очень похожи по физическим свойствам.

Изменить: что выбрать

(Это также зависит от требований к производительности сервера и допустимого риска.)

Если среда серверов достаточно хороша для аппаратного обеспечения (colo, климатизировано и т. Д.), У вас все будет в порядке с RAID5 + горячим резервированием.

Если окружающая среда повышает вероятность выхода из строя более чем одного диска за короткое время (вибрация, влажность, грязь), тогда переходите к RAID 6.

Всегда также иметь адекватное резервное копирование и тестовое восстановление.

Редактировать 2: Приличные контроллеры RAID имеют очистку , которая периодически проверяет все сектора.


+1 за "иметь адекватное резервное копирование и тестовое восстановление". Это ПЕРВАЯ вещь, которую должен иметь каждый, прежде чем начать беспокоиться об уровнях RAID.
Уоррен

3

RAID5 использует одну полосу четности. Необходимо рассчитать исправление ошибок Рида-Соломона и записать две полосы для RAID6 и одну для RAID5. RAID5 используется для приложений с интенсивной базой данных, где объем хранилища огромен из-за стоимости RAID10. Стоимость RAID5 варьируется от 67% до 94% доступности диска, где RAID10 составляет 50% (гораздо более высокие затраты на хранение). В то время как RAID6 имеет меньшую задержку чтения на очень небольшую величину из-за задержки вращения, RAID6 от 25 до 31% медленнее при записи из-за расчет исправления ошибок и дополнительная запись бита четности.

Используя среднее время между отказами (MTBF) для дисков, вероятность отказа двух дисков один за другим или в одно и то же время равна (0.1% x 0.1%)*12или 0.001 x 0.001 * 12; если у вас работает 1000 дисков, то в среднем вы теряете ~ 1,2 диска в год. Два привода будут выходить из строя один раз за другим примерно каждые 8,3 года. Теперь, поскольку сбой диска не является распределением Пуассона из-за больших нагрузок на диск во время восстановления, более вероятен сбой второго диска в течение этого периода, и распределение ближе к гамма-распределению с немного более высокими значениями после происходит сбой.

Суть в том, что производительность для RAID5 превосходит RAID6 при записи, а для приложений БД - намного лучше. Для приложений, которые чаще всего читают, таких как веб-сервер, это не имеет значения, и вам следует использовать RAID6. Экономические преимущества использования RAID5 по сравнению с RAID10 огромны для больших хранилищ. Если вы можете позволить себе накладные расходы, используйте RAID10 для приложений с интенсивным использованием диска. RAID10 всегда будет работать лучше.

Самым большим пропущенным итогом является то, что RAID - это НЕ резервное копирование, а способ ограничения времени простоя за счет обеспечения избыточности. Если данные критически важны, вы должны сделать их резервную копию (и протестировать процесс восстановления).

В случае сбоя одного RAID-массива из 10 жестких дисков SAS емкостью 2 ТБ восстановление будет стоить тысячи долларов, а восстановление займет недели, если это вообще возможно.

Все RAID-массивы в итоге выходят из строя!


1

Говоря строго с точки зрения целостности данных, да. Вы можете безопасно потерять любые два диска, хотя это редкий случай потерять два вместе, за исключением серьезной физической травмы системы.

Финансово, не так много. Горячий резерв может быть отключен до необходимости, что означает, что он не потребляет энергию и не изнашивается.

И, как всегда, RAID не является заменой правильного плана резервного копирования за пределы площадки.


1

Вы рассматривали 10? Если у вас достаточно дисков для raid 6, у вас достаточно для 10 томов. В большинстве случаев 10 является более быстрым и более избыточным (за счет некоторого дискового пространства).


10 поддерживает только 4 диска. поэтому рейд 10 не вариант ИМО.
Тревор Бойд Смит

1
@Trevor Raid 10 поддерживает любое четное количество дисков> = 4. Если вы можете делать рейд 6, вы можете делать рейд 10.
Джоэл Коухорн

1

Эти ответы кажутся неверными, потому что они основаны ТОЛЬКО на теоретической производительности привода. Учтите, что если у вас RAID-контроллер с 1 ГБ кэш-памяти, то запись (обычно при нормальной нагрузке, а не в сценарии с большой ненормальной высокой нагрузкой) происходит немедленно с точки зрения пользователя или приложения - она ​​идет в память, а затем «фактическая» запись происходит во время работы привода.

Тем не менее, чтение не может быть «подделано» (ускорено с помощью кэша), если те же данные не были недавно или обычно уже загружены. Рейд 6 лучше для чтения и более терпим (2 против одного диска). Raid 5 медленнее пишет и действительно медленно восстанавливает.

Таким образом, хотя RAID 5 будет медленным при реальной записи, он будет скрыт с помощью хорошего raid-контроллера, где запись происходит в памяти с точки зрения пользователя / приложения. Тем не менее, Raid 5 медленнее, чем raid 6, и это не будет улучшено с помощью контроллера, если данные не были уже загружены или алгоритм не ведет запись повторных чтений. В реальной жизни - в рейде 6 побед.

В заключение, запись в Raid 5 является медленной, но скрытой с хорошим контроллером, и это делает raid 5 или 6 практически одинаковыми с «воспринимаемой» производительностью при записи (есть некоторые исключения). Однако Raid 6 читает быстрее, и контроллеры, вероятно, не помогут в реальной рабочей нагрузке улучшить производительность чтения. Теперь добавьте, что Raid 6 может принять два сбоя, а Raid 5 + 1 - только один, и вам будет легче выбрать Raid 6 в качестве лучшего варианта: не забывайте, что восстановление на Raid 5 тоже очень медленное. Я также узнал, что диски Raid 6 используются (таким образом, проверены правильно), и диски, которые выходят из строя, имеют тенденцию очень быстро выходить из строя. Как только срок действия массива превышает 30 дней, он может длиться годами. Горячий резерв не проверен и может фактически сразу же выйти из строя, когда это необходимо.


0

Это факты дела, и они неоспоримы (любой, кто знает, о чем они говорят):

  1. RAID5 + hotspare - буквально худший из возможных вариантов RAID.
  2. RAID10 должен быть выбором по умолчанию, если вы заботитесь о своих данных (то есть вы зависите от них, например, для поддержания своего бизнеса).

Если вы рассматриваете все возможные варианты RAID, то ни в одном случае не будет наилучшим выбором горячей точки RAID5 +, в первую очередь потому, что если у вас есть горячая запас RAID5 +, это означает, что у вас есть 4 диска, а с 4 дисками вы можете использовать RAID6 или даже лучше можно сделать RAID10.

С 4 накопителями вы получаете одно и то же полезное хранилище из всех вариантов (R5 + HS, R6, R10).

Если ваша цель - производительность, то RAID10 будет лучше, чем RAID5 и RAID6.

Если ваша цель - безопасность, RAID6 или RAID10 превосходят RAID5 с горячей точкой или без нее. Это спорно, который один является более безопасным (6 против 10). RAID6 может выдержать отказ двух дисков, но из-за неисправимых ошибок чтения (URE) также возможно, что сбой одного диска в RAID6 приведет к гибели всего массива.

RAID10, поскольку он не основан на четности, не имеет той же проблемы с URE. Если RAID четности (R5 и т. Д.) Теряет диск, а затем встречает URE, весь массив теряется. В случае RAID1 или RAID10, если диск потерян, а затем на зеркальном диске обнаружена URE, теряется только нечитаемый сектор.

Смотрите здесь для подробного объяснения, почему RAID5 является худшим вариантом . Также см. Здесь список разумных вариантов RAID по количеству дисков . Обратите внимание, что ни в коем случае RAID5 не является лучшим выбором (независимо от горячей точки).


2
Я не согласен. RAID5 имеет свое применение. (например, когда бюджет ограничен, и вам действительно нужно дисковое пространство). А поскольку RAID не заменяет резервную копию, оставшуюся в живых после одного отказа диска, этого достаточно, чтобы проскочить вас до 17:00, после чего люди покидают офис, а вы выполняете аварийное обслуживание.
Хеннес

Существует разница между «лучшим выбором» и «лучшим выбором, который вы можете себе позволить». RAID5 никогда не был лучшим выбором. Люди приходят сюда, чтобы получить лучший ответ, и люди должны уходить отсюда, зная, что RAID5 всегда меньше лучшего. Математически доказано, что в некоторых случаях RAID0 более надежен, чем RAID5. Вот как страшный RAID5. Во многих случаях RAID5 может не дойти до 5 вечера. Существует большая разница между теорией и реальным миром, когда дело доходит до RAID5. Смотрите здесь
user1594322

Мне совсем не понятно, почему вы говорите, что у RAID10 нет такой же проблемы с URE. В случае установки RAID10 с четырьмя дисками, если вы потеряете один диск и получите URE на соответствующем зеркале, вы в равной степени надуты.
ChrisInEdmonton

Если у RAID10 есть неисправный диск, а затем на оставшемся диске есть URE, вы потеряете только нечитаемый сектор, а не весь массив. Обновил ответ.
user1594322
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.