[NB: см. Обновление 1 ниже.] Я считаю, что методологию rpart
гораздо проще объяснить, чем party
. Последний, однако, гораздо более сложный и, вероятно, даст лучшие модели. Способ, который я иногда объясняю, party
состоит в том, чтобы говорить об этом как о основе для создания локальных линейных (или GLM) моделей. Я подкрепляю это тем, что указываю, что результаты для rpart
постоянны для всех элементов, попадающих в конечный узел, то есть для блока / области, ограниченной разбиениями. Даже если могут быть улучшения с помощью локальных моделей, вы не получите ничего, кроме постоянного прогноза.
Напротив, party
развивает расколы, чтобы потенциально оптимизировать модели для регионов. На самом деле он использует критерии, отличные от оптимальности модели, но вам нужно измерить свою способность объяснить разницу, чтобы определить, можете ли вы объяснить это хорошо. Документы для него довольно доступны для исследователя, но могут быть довольно сложными для тех, кто не желает рассматривать более простые методы, такие как случайные леса, бустинг и т. Д. Математически, я думаю, что party
это более изощренно ... Тем не менее, модели CART легче объяснить, как с точки зрения методологии и результатов, и они обеспечивают достойную ступеньку для внедрения более сложных моделей на основе дерева.
Короче говоря, я бы сказал, что вы должны сделать rpart
для ясности, и вы можете использовать party
для точности / производительности, но я бы не стал представлятьparty
без представления rpart
.
Обновление 1. Я основал свой ответ на моем понимании, party
как это было год или два назад. Он немного вырос, но я бы изменил свой ответ, сказав, что я все еще рекомендую rpart
его краткость и унаследованность, если «ненастоящий» будет важным критерием для вашего клиента / сотрудника. Тем не менее, я бы попытался перейти на использование большего количества функциональных возможностей party
после того, как представил кого-то rpart
. Лучше начать с малого, с функций потерь, критериев расщепления и т. Д. В простом контексте, прежде чем вводить пакет и методологию, включающие гораздо более сложные концепции.