Сегодня мы столкнулись с каким-то худшим сценарием и открыты для любых хороших идей.
Вот наша проблема:
Мы используем несколько выделенных серверов хранения для размещения наших виртуальных машин. Прежде чем я продолжу, вот спецификации:
- Выделенный сервер
- RAID-контроллер Areca 1280ml, Прошивка 1.49
- 12x жесткие диски Samsung объемом 1 ТБ
Мы настроили один RAID6-набор с 10 дисками, который содержит один логический том. У нас есть два горячих резерва в системе.
Сегодня один жесткий диск вышел из строя. Это происходит время от времени, поэтому мы заменили его. После восстановления второй диск не удалось. Обычно это не весело. Мы остановили тяжелые операции ввода-вывода, чтобы обеспечить стабильное восстановление RAID.
К сожалению, диск горячего резервирования потерпел неудачу во время восстановления, и все это прекратилось.
Теперь у нас следующая ситуация:
- Контроллер говорит, что набор рейдов восстанавливается
- Контроллер говорит, что громкость не удалось
Это система RAID 6 и два диска вышли из строя, поэтому данные должны быть целыми, но мы не можем снова подключить том к сети для доступа к данным.
При поиске мы нашли следующие выводы. Я не знаю, хорошие они или плохие
Зеркальное отображение всех дисков для второго набора дисков. Таким образом, у нас была бы возможность попробовать разные вещи, не теряя больше, чем у нас уже есть.
Попытка перестроить массив в R-Studio. Но у нас нет реального опыта работы с программным обеспечением.
Вытащить все диски, перезагрузить систему, перейти в биос контроллера ареки, заново установить жесткие диски по одному. Некоторые люди говорят, что это привело систему онлайн к этому. Некоторые говорят, что эффект равен нулю. Некоторые говорят, что они взорвали все это.
Использование недокументированных команд ареки, таких как «спасение» или «LeVel2ReScUe».
Обращение в службу компьютерной экспертизы. Но вот ... первичные оценки по телефону превысили 20.000 €. Вот почему мы просим о помощи. Может быть, мы упускаем очевидное?
И да, конечно, у нас есть резервные копии. Но некоторые системы потеряли одну неделю данных, поэтому мы хотели бы снова запустить и запустить систему.
Любая помощь, предложения и вопросы приветствуются.
dd
зеркалом всех дисков, просто чтобы предотвратить больший ущерб и иметь запасной план при работе над реальным решением.