Я рассматриваю возможность использования установки RAID0 для одного из наших кластеров SQL Server. Я обрисую ситуацию и ищу, почему это может быть плохой идеей. Кроме того, если кто-то, у вас есть примеры использования, официальные документы или другая документация, вы можете указать мне на эту тему, это было бы здорово.
У нас есть 3 сервера в 2 центрах обработки данных, которые являются частью кластера SQL. Все они работают на SQL Server в группе доступности. У основного объекта есть точная копия, сидящая рядом с ним, а другая - в другом центре обработки данных. Они запускают синхронную репликацию с автоматическим переключением при сбое. Все диски являются твердотельными накопителями корпоративного класса. Они будут работать под управлением SQL Server 2017 или 2019.
Я думаю, что их использование в массивах RAID0 будет иметь множество преимуществ по сравнению с другими методами, но с некоторыми реальными недостатками. Единственный минус, который я сейчас вижу, - это отсутствие избыточности на основном сервере, поэтому сбой увеличивается. Как плюсы:
Если диск выходит из строя, а не работает в замедленном, ухудшенном состоянии до тех пор, пока кто-то не получит уведомление и не будет действовать вручную, сервер немедленно перестанет работать на вторичном сервере, поддерживая полную работоспособность. Это даст нам дополнительное преимущество, сообщив нам о сбое, поэтому мы сможем быстрее выяснить причину.
Это снижает вероятность отказа в целом по емкости ТБ. Поскольку нам не нужны диски четности или зеркальные диски, мы уменьшаем количество дисков на массив. Чем меньше дисков, тем меньше вероятность отказа диска.
Это дешевле. Требование меньшего количества дисков для нашей требуемой емкости, очевидно, стоит меньше.
Я знаю, что это не обычное деловое мышление, но есть ли что-то, что я не рассматриваю? Я хотел бы любой вклад или за или против.
Я не пытаюсь сделать это для повышения производительности запросов, хотя, если есть значимые, не стесняйтесь указывать на них. Моя главная задача - не рассмотреть или не решить проблему надежности или избыточности, о которой я не задумывался.
Операционная система находится на отдельном зеркальном диске, поэтому сам сервер должен работать. Один из этих дисков можно заменить и снова отразить. Он маленький и на нем нет никаких файлов базы данных, кроме системных. Я не могу представить, что это займет больше минуты. В случае сбоя одного из массивов данных мы заменяем диск, перестраиваем массив, восстанавливаем и повторно синхронизируем с AG. По моему личному опыту, восстановление было НАМНОГО быстрее, чем восстановление диска RAID5. У меня никогда не было сбоя RAID1, поэтому я не знаю, будет ли это восстановление быстрее или нет. Восстановление будет происходить из резервной копии и переноситься вперед, чтобы соответствовать первичному, поэтому увеличение нагрузки на первичном сервере должно быть очень минимальным, только синхронизируя последние несколько минут журналов с восстановленной репликой.