Статистика и большие данные importance

2

Меры переменной значимости в случайных лесах

Я играл со случайными лесами для регрессии, и мне трудно понять, что именно означают эти два показателя важности и как их следует интерпретировать. importance()Функция дает два значения для каждой переменной: %IncMSEи IncNodePurity. Есть ли простые интерпретации для этих двух значений? В IncNodePurityчастности, действительно ли это просто увеличение RSS после удаления …

40 r machine-learning random-forest importance

4

Для чего нужны переменные рейтинги важности?

Я стал чем-то вроде нигилистов, когда дело доходит до переменных уровней ранжирования (в контексте многомерных моделей всех видов). Часто в ходе моей работы меня просят либо помочь другой команде составить рейтинг с переменной степенью важности, либо создать рейтинг с переменной степенью важности из моей собственной работы. В ответ на эти …

25 multiple-regression multivariate-analysis importance

4

Максимальное количество независимых переменных, которые можно ввести в уравнение множественной регрессии

Какое количество независимых переменных можно ввести в уравнение множественной регрессии? У меня есть 10 предикторов, которые я хотел бы изучить с точки зрения их относительного вклада в переменную результата. Должен ли я использовать коррекцию Бонферрони, чтобы скорректировать несколько анализов?

19 regression predictor importance bonferroni

3

Оценка наиболее важных функций в разделе кластера k-средних

Есть ли способ определить, какие особенности / переменные набора данных являются наиболее важными / доминирующими в кластерном решении k-средних?

19 machine-learning clustering k-means importance

2

Переменная важность от GLMNET

Я смотрю на использование лассо в качестве метода выбора признаков и подбора прогнозирующей модели с бинарной целью. Ниже приведен код, с которым я играл, чтобы опробовать метод с регуляризованной логистической регрессией. Мой вопрос заключается в том, что я получил группу «значимых» переменных, но могу ли я упорядочить их, чтобы оценить …

18 logistic importance glmnet

5

Понимание того, какие особенности были наиболее важны для логистической регрессии

Я построил классификатор логистической регрессии, который очень точен в моих данных. Теперь я хочу лучше понять, почему это так хорошо работает. В частности, я хотел бы оценить, какие функции вносят наибольший вклад (какие функции являются наиболее важными) и, в идеале, количественно оценить, насколько каждая функция вносит вклад в точность общей …

17 machine-learning logistic feature-selection importance

2

Важность функции с фиктивными переменными

Я пытаюсь понять, как я могу получить важность функции категориальной переменной, которая была разбита на фиктивные переменные. Я использую Scikit-Learn, который не обрабатывает категориальные переменные для вас, как R или H2O. Если я разобью категориальную переменную на фиктивные переменные, я получу отдельные значения свойств для каждого класса в этой переменной. …

17 categorical-data random-forest interpretation importance

3

Как разделить r-квадрат между переменными предиктора в множественной регрессии?

Я только что прочитал статью, в которой авторы провели множественную регрессию с двумя предикторами. Общее значение r-квадрата составило 0,65. Они предоставили таблицу, которая делит r-квадрат между двумя предикторами. Стол выглядел так: rsquared beta df pvalue whole model 0.65 NA 2, 9 0.008 predictor 1 0.38 1.01 1, 10 0.002 predictor …

16 r multiple-regression r-squared importance variance-decomposition

4

Сравнивая важность различных наборов предикторов

Я советовал студенту-исследователю с конкретной проблемой, и я хотел, чтобы на этом сайте присутствовали другие. Контекст: Исследователь имел три типа предикторных переменных. Каждый тип содержал различное количество переменных-предикторов. Каждый предиктор был непрерывной переменной: Социальные: S1, S2, S3, S4 (т.е. четыре предиктора) Когнитивный: С1, С2 (т.е. два предиктора) Поведение: B1, B2, …

13 regression predictor importance

1

В Случайном Лесу, почему случайное подмножество объектов выбрано на уровне узла, а не на уровне дерева?

Мой вопрос: почему случайный лес учитывает случайные подмножества объектов для разбиения на уровне узла в каждом дереве, а не на уровне дерева ? Справочная информация: это вопрос истории. Тин Кам Хо опубликовал эту статью о построении «лесов принятия решений» путем случайного выбора подмножества объектов, которые будут использоваться для выращивания каждого …

13 machine-learning feature-selection random-forest importance history

2

Как определить относительную значимость переменной в логистической регрессии в терминах p?

Предположим, что модель логистической регрессии используется для прогнозирования того, будет ли покупатель онлайн покупать продукт (результат: покупка) после того, как он нажал на набор онлайн-рекламы (предикторы: Ad1, Ad2 и Ad3). Результатом является двоичная переменная: 1 (купленная) или 0 (не приобретенная). Предикторами являются также двоичные переменные: 1 (нажата) или 0 (не …

11 logistic importance

1

randomForest и ошибка важности переменной?

Я не получаю разницу между rfobject$importanceи importance(rfobject)в столбце MeanDecreaseAccuracy. Пример: > data("iris") > fit <- randomForest(Species~., data=iris, importance=TRUE) > fit$importance setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648 Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105 Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869 Petal.Width 0.349686983 0.318527008 0.270975757 0.31054451 46.323415 > …

10 r random-forest importance

2

Значение переменной randomForest отрицательные значения

Я спрашиваю себя, стоит ли удалять те переменные с отрицательным значением важности переменной ("% IncMSE") в контексте регрессии. А если это даст мне лучший прогноз? Что вы думаете?

10 machine-learning feature-selection random-forest importance

1

Как сравнить наблюдаемые и ожидаемые события?

Предположим, у меня есть одна выборка частот из 4 возможных событий: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 и у меня есть ожидаемые вероятности того, что мои события произойдут: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 С суммой наблюдаемых частот …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

Вопросы с тегом «importance»