Я заметил, что в предыдущих ответах отсутствуют общие соображения HPC.
Прежде всего, ни один из этих пакетов не позволит вам запустить один SVM параллельно. Так что вы можете ускорить оптимизацию параметров или перекрестную проверку, но вы должны написать свои собственные функции для этого. Или, конечно, вы можете запустить задание для разных наборов данных параллельно, если это так.
Вторая проблема - память; если вы хотите распределить вычисления по нескольким физическим компьютерам, бесплатный обед не требуется, и вы должны скопировать данные - здесь вы должны рассмотреть, имеет ли смысл заранее распространять копию данных между компьютерами, чтобы сохранить связь. С другой стороны, если вы хотите использовать несколько ядер на одном компьютере, особенно подходит многоядерный, поскольку он позволяет всем дочерним процессам получать доступ к памяти родительского процесса, что позволяет сэкономить некоторое время и много места в памяти.