Это действительно зависит от того, что вы пытаетесь достичь, и что вы подразумеваете под «распределенным вычислительным кластером». Однажды я проделал аналогичную вещь в Uni, используя старые машины и PVM , это «кластер» в смысле группы машин, действующих как единый компьютер для параллельной обработки, например кластеров Beowulf. Конечно, вам понадобится код, который написан, чтобы воспользоваться этим.
Хорошим местом для начала будет определение того, что вы ищете, чтобы изучить этот проект. Я рекомендую для начала прочитать статью в Википедии о параллельных вычислениях , а затем уточнить ваши потребности в зависимости от того, что вы хотите сделать.
Простая система организации очередей (например, механик ) может быть достаточной для быстрого получения отличных результатов.
Проблема, с которой я столкнулся при создании кластера параллельных вычислений, заключалась в том, что у меня не было с этим ничего общего, он просто находился там, но это был забавный проект, и я многому научился. В любом случае, вы, вероятно, будете учиться совсем немного и получать удовольствие одновременно, независимо от того, что вы решите реализовать.
Что касается выбора дистрибутивов, я бы выбрал то, что мне больше всего понравилось, так как вам, вероятно, придется устанавливать вещи из исходников. Как только вы освоитесь с настройкой, вы сможете найти дистрибутив, который больше соответствует вашим потребностям. Но любой дистрибутив должен делать.
Какое программное обеспечение для настройки кластера? Это полностью зависит от того, какой тип кластера вы создаете.
На борту против распределенной ФС? Опять же, это зависит от требований к вашему кластеру. Будет ли каждый узел передавать данные назад и вперед среди других узлов? Будут ли они работать как рабы с одним хозяином? будут ли они действовать совершенно независимо? Эти вопросы начнут информировать вас о вашем выборе. И, конечно, всегда есть компромиссы.
Некоторые другие ссылки, которые могут оказаться интересными:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/