Этот ответ был отредактирован после уточнения вопроса.
Каковы другие причины влияния облаков на DAS?
Где «DAS» означает хранилище с прямым подключением, то есть жесткие диски SATA или SAS.
Все поставщики облачных услуг используют DAS, потому что он предлагает на порядок улучшения цены / производительности. Это случай горизонтального масштабирования .
Короче говоря, жесткие диски SATA и контроллеры SATA являются дешевым товаром. Это продукты для массового рынка, и цены на них очень низкие. Создав большой кластер дешевых ПК с дешевыми дисками SATA, Google, Amazon и другие получают огромную емкость по очень низкой цене. Затем они добавляют свой собственный программный слой сверху. Их программное обеспечение выполняет многосерверную репликацию для обеспечения производительности и надежности, мониторинга, повторной балансировки репликации после сбоя оборудования и других вещей.
Вы могли бы взглянуть на MogileFS как на более простой представитель того типа программного обеспечения, которое Google, Amazon и другие используют для хранения. Конечно, это другая реализация, но в ней используются те же цели и решения, что и в крупных системах. Если вы хотите, вот прыжок для получения дополнительной информации о GoogleFS .
далее в статье указывается, что облака должны использовать SAN или NAS, поскольку DAS не подходит, когда виртуальная машина перемещается на другой сервер.
Есть 2 причины, по которым SAN не используются.
1) Цена.
SAN чрезвычайно дороги в больших масштабах. Хотя они могут быть технически «лучшим» решением, они обычно не используются в очень крупных установках из-за стоимости.
2) Теорема CAP Теорема CAP
Эрика Брюера показывает, что в очень большом масштабе вы не можете поддерживать строгую согласованность при сохранении приемлемой надежности, отказоустойчивости и производительности. SAN - это попытка обеспечить согласованность аппаратных средств. Это может хорошо работать для установки сервера 5.000, но никогда не было доказано, что он работает для 250.000+ серверов Google.
Результат:
Пока производители облачных вычислений решили довести сложность поддержания состояния сервера до разработчика приложений. Текущие облачные предложения не обеспечивают согласованное состояние для каждой виртуальной машины. Серверы приложений (виртуальные машины) могут выйти из строя, и их локальные данные могут быть потеряны в любое время.
У каждого поставщика есть своя собственная реализация постоянного хранения, которую вы должны использовать для важных данных. Предложения Amazon являются хорошими примерами; MySQL , SimpleDB и Simple Storage Service . Сами эти предложения отражают теорему CAP - экземпляр MySQL имеет сильную согласованность, но ограниченную масштабируемость. SimpleDB и S3 фантастически масштабируются, но только в конечном итоге согласуются.