Я не распределенная файловая система, ниндзя, но после объединения как можно большего количества дисков на как можно меньшее количество компьютеров я попытаюсь использовать iSCSI для подключения большей части компьютеров к одной основной машине. Там я мог бы объединить вещи в надежное хранилище. Предпочтительно, отказоустойчив в пределах машины (если диск отключен) и между машинами (если вся машина выключена).
Лично мне нравится ZFS. В этом случае полезно использовать сжатие, дедупликацию и отказоустойчивость. Тем не менее, я уверен, что есть много других способов сжатия данных, делая их отказоустойчивыми.
Хотел бы я порекомендовать реальное решение для распределенных файлов «под ключ», я знаю, что это действительно круто, но я надеюсь, что оно направит вас в правильном направлении.
Редактировать: я все еще новичок в ZFS и настройке iSCSI, но вспомнил, что видел видео от Sun в Германии, где они демонстрировали отказоустойчивость ZFS. Они подключили три USB-концентратора к компьютеру и вставили четыре флэш-накопителя в каждый концентратор. Затем, чтобы любой концентратор не мог отключить пул хранения, они создали том RAIDz, состоящий из одного флэш-диска из каждого концентратора. Затем они объединяют четыре тома ZFS RAIDz вместе. Таким образом, только четыре флешки использовались для проверки четности. Затем, конечно, отключенный концентратор, который ухудшил работу каждого zpool, но все данные были доступны. В этой конфигурации может быть потеряно до четырех дисков, но только если два любых диска не находятся в одном пуле.
Если бы эта конфигурация использовалась с необработанным диском каждого блока, это позволило бы сохранить больше дисков для данных, а не для контроля четности. Я слышал, что FreeNAS может (или собирался иметь возможность) совместно использовать диски в «сыром» виде через iSCSI, поэтому я предполагаю, что Linux может делать то же самое. Как я уже сказал, я все еще учусь, но этот альтернативный метод будет менее расточительным с точки зрения четности привода, чем мое предыдущее предложение. Конечно, это будет зависеть от использования ZFS, который я не знаю, будет ли приемлемым. Я знаю, что лучше всего придерживаться того, что вы знаете, если вам придется что-то строить / поддерживать / ремонтировать, если только это не опыт обучения.
Надеюсь, это лучше.
Изменить: сделал некоторые копания и нашел видео, о котором я говорил. Часть, где объясняется распространение USB-флешки по концентраторам, начинается с 2m10s. Видео демонстрирует их сервер хранения «Thumper» (X4500) и рассказывает о том, как распределить диски между контроллерами, чтобы в случае сбоя контроллера жесткого диска ваши данные оставались хорошими. (Лично я думаю, что это просто видео о гиках, которые веселятся. Хотелось бы, чтобы у меня была коробка с Thumper, но моя жена не хотела бы, чтобы я управлял домкратом для паллет по дому.: D Это одна большая коробка.)
Редактировать: Я вспомнил, как общался через распределенную файловую систему под названием OpenAFS . Я не пробовал, я только читал об этом. Возможно, другие знают, как это происходит в реальном мире.