Ответы:
Дедупликация - это место, где вы просматриваете содержимое набора данных, отмечаете все присутствующие дублирующиеся биты и сохраняете данные только один раз, заменяя все эти иные копии данных указателем на одну копию. Это особенно полезно при резервном копировании, потому что при резервном копировании таких вещей, как серверы, большая часть данных остается одинаковой. Представьте, например, что вы создаете резервную копию 1000 серверов Windows - большая часть содержимого этих блоков будет идентичной.
Дедупликация сегодня так популярна по 3 причинам:
В последнее время все одержимы созданием решений для аварийного восстановления, которые используют сторонние серверы. Для этого вам нужно скопировать много производственных данных на удаленный сайт, и пропускная способность является огромной проблемой. Любое сокращение количества данных, которые вы должны копировать, очень помогает.
Количество данных, которые компании хранят, стремительно растет - благодаря более дешевым хранилищам и многопрофильным требованиям к хранению записей.
Технология сравнительно недавно попала в сладкое место. У нас были такие вещи, как дедупликация в течение длительного времени (хранилище одного экземпляра и т. Д.), Который помог, но только в прошлом году или около того мы видели реальную дедупликацию, которая может значительно уменьшить объем хранилища, попавший в основной поток.
Одна из вещей, которую мы выяснили в моей компании при работе с Netapp, заключается в том, что дедупликация действительно хорошо работает только в среде виртуальных машин, если вы настроили диски. Что является проблемой для нас, так как у нас много машин с Windows Server 2003, и ни один из дисков не выровнен. Это означает, что вы едва восстанавливаете примерно четверть возможного пространства, если диски правильно выровнены.
Нам говорят, однако, что, как только диски выровнены правильно, мы сможем восстановить 40-60% нашего пространства обратно с дедупликацией.