Sobrique объясняет, как ручное вмешательство делает предлагаемое решение оптимальным , и рассказывает о вероятности отказа различных компонентов . Обе эти ИМО делают очень хорошие замечания и должны быть решительно рассмотрены.
Однако есть одна проблема, которую пока никто не комментирует, что меня немного удивляет. Вы предлагаете:
сделайте [текущий хост горячего резервирования] холодным резервом, возьмите жесткие диски и поместите их в основной хост и измените RAID с 1 на 1 + 1.
Это не защитит вас от действий ОС на диске.
Он только защищает вас от сбоя диска, который, перемещаясь с зеркал (RAID 1) на зеркала зеркал (RAID 1 + 1), вы значительно уменьшите влияние с самого начала. Вы можете получить тот же результат, увеличив число дисков в каждом наборе зеркал (например, перейдите с 2-дискового RAID 1 на 4-дисковый RAID 1), а также вполне вероятно, улучшив производительность чтения во время обычных операций.
Хорошо, тогда давайте посмотрим на некоторые способы, которыми это может потерпеть неудачу .
- Допустим, вы устанавливаете обновления системы, и что-то вызывает сбой процесса на полпути; возможно, произошел сбой питания и ИБП , или, может быть, вы попали в странную аварию и столкнулись с серьезной ошибкой в ядре (в наши дни Linux довольно надежен, но риск все же есть).
- Возможно, при обновлении возникает проблема, которую вы не уловили во время тестирования (вы делаете тестовые обновления системы, верно?), Требующий аварийного переключения на вторичную систему, пока вы исправляете первичную
- Возможно, ошибка в коде файловой системы приводит к ложной, неправильной записи на диск.
- Может быть, толстый (или даже злой) администратор делает
rm -rf ../*
или rm -rf /*
вместо rm -rf ./*
.
- Возможно, ошибка в вашем собственном программном обеспечении приводит к серьезному повреждению содержимого базы данных.
- Может быть, вирус удается проникнуть внутрь.
Может быть, может быть, возможно ... (и я уверен, что есть много других способов, с помощью которых ваш предложенный подход может потерпеть неудачу.) Однако, в конце концов, это сводится к тому, что "два набора всегда синхронизированы", "преимущество" Иногда вы не хотите, чтобы они были идеально синхронизированы.
В зависимости от того, что именно произошло, именно тогда вам понадобится либо горячий или холодный резерв, готовый для включения и переключения, либо правильное резервное копирование. В любом случае зеркала RAID зеркал (или зеркала RAID) не помогут вам, если режим сбоя включает в себя многое, кроме отказа аппаратного запоминающего устройства (сбой диска). Что-то вроде raidzN в ZFS, вероятно, может быть немного лучше в некоторых отношениях, но совсем не лучше в других.
Для меня это сделало бы ваш предложенный подход безпроблемным с самого начала, если целью является какое-либо аварийное аварийное переключение.