Куча новых файлов с уникальными именами файлов регулярно «появляется» 1 на одном сервере. (Подобно сотням ГБ новых данных ежедневно, решение должно масштабироваться до терабайт. Каждый файл имеет размер несколько мегабайт, до нескольких десятков мегабайт.)
Есть несколько машин, которые обрабатывают эти файлы. (Десятки, если решение масштабируется до сотен.) Должна быть возможность легко добавлять и удалять новые машины.
Существуют резервные серверы хранения файлов, на которые каждый архивный файл должен быть скопирован для архивного хранения. Данные не должны быть потеряны, все входящие файлы должны быть доставлены на сервер резервного копирования.
Каждый входящий файл может быть доставлен на один компьютер для обработки и должен быть скопирован на сервер резервного хранилища.
Сервер-получатель не должен хранить файлы после того, как отправил их в путь.
Посоветуйте надежное решение для распространения файлов способом, описанным выше. Решение не должно основываться на Java. Unix-way решения предпочтительнее.
Серверы на базе Ubuntu, расположены в одном дата-центре. Все остальное можно адаптировать под требования решения.
1 Обратите внимание, что я намеренно опускаю информацию о том, как файлы переносятся в файловую систему. Причина в том, что в настоящее время файлы отправляются третьими лицами несколькими различными устаревшими способами (как ни странно, через scp и через ØMQ). Кажется, проще разрезать межкластерный интерфейс на уровне файловой системы, но если для того или иного решения действительно потребуется какой-то определенный транспорт - устаревшие транспорты могут быть обновлены до этого.
