Это зависит от вашей цели.
Если вы ищете резервные копии для аварийного восстановления (сервер взорван, центр обработки данных сгорел и т. Д.), То краткий ответ - они могут вообще не делать резервных копий. У нас есть клиент, который работает с конфиденциальными правительственными данными, и часть его мандата заключается в том, что нам не разрешается делать резервные копии или резервные копии на съемных носителях . Нам разрешают живую репликацию на сайт DR и все. Оба сайта имеют одинаковый уровень физической и логической безопасности. Подвох в том, что если я что-то напортачу на сайте А, то он почти мгновенно копируется на сайт Б.
Если вы говорите о резервном копировании с точки зрения целостности данных (например, вы случайно удалили таблицу «Клиенты», и она уже реплицирована на сайт DR), то ленты LTO-5 в большой ленточной библиотеке часто подходят. Имея до 3 ТБ на ленту и несколько лент в ленточной библиотеке, вы можете быстро создавать резервные копии огромных объемов данных (быстрое здесь относится к Мбит / с, резервное копирование 25 ТБ данных может занять много-много часов).
Любой приличный набор резервных копий будет обеспечивать высокую степень сжатия и дедупликации, что значительно сокращает объем требуемого дискового пространства. Я видел оценку для инструмента резервного копирования со сжатым и лишенным дублирования, когда он требовал соотношение 15: 1 (15 ГБ данных, хранящихся в 1 ГБ резервных копий).
Я очень сомневаюсь, что Google беспокоится о резервных копиях для большей части своих данных поисковой системы, потому что большая часть этих данных является сменной, и она распространяется настолько широко и широко, что, если они потеряют даже значительную часть, или, возможно, даже весь, центр обработки данных, система останется онлайн благодаря отказоустойчивым маршрутам BGP.
На самом деле, похоже, что Google выполняет резервное копирование метрической мелочи данных на ленту , а это не совсем то, чего я ожидал: