Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.

1
Как сделать возрастную пирамиду похожей на сюжет в R?
Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Возрастная пирамида выглядит следующим образом: я хотел бы сделать что-то похожее, а именно 2 барплота (не гистограммы) с одинаковыми категориями, повернутыми вертикально …

4
МЕНЬШЕ, что позволяет разрывы
Существует ли метод моделирования, такой как LOESS, который допускает ноль, один или несколько разрывов, где время разрывов не известно априори? Если метод существует, есть ли существующая реализация в R?

2
Почему оценка ошибки случайного леса OOB улучшается при уменьшении количества выбранных объектов?
Я применяю алгоритм случайного леса в качестве классификатора для набора данных микрочипов, который разделен на две известные группы с тысячами объектов. После первого запуска я смотрю на важность функций и снова запускаю алгоритм дерева с 5, 10 и 20 наиболее важными функциями. Я обнаружил, что для всех 10-ти и 20-ти …

3
Пакет R для логистической регрессии с фиксированным эффектом
Я ищу Rпакет для оценки коэффициентов логит-моделей с индивидуальным фиксированным эффектом (индивидуальный перехват) с использованием оценки Чемберлена 1980 года. Это часто называют оценкой логита Чемберлена с фиксированным эффектом. Это классическая оценка при работе с бинарными данными панели результатов (по крайней мере, в эконометрике), но я просто не нахожу ничего связанного …

2
Что будет означать доверительный интервал вокруг прогнозируемого значения из модели смешанных эффектов?
Я смотрел на эту страницуи заметил методы для доверительных интервалов для lme и lmer в R. Для тех, кто не знает R, это функции для генерации смешанных эффектов или многоуровневых моделей. Если бы у меня были фиксированные эффекты в чем-то вроде схемы повторных измерений, что бы означал доверительный интервал вокруг …

5
Модель смешанных эффектов: сравнить компонент случайной дисперсии по уровням группирующей переменной
Предположим, у меня есть участников, каждый из которых дает ответ 20 раз, 10 в одном состоянии и 10 в другом. Я подхожу к линейной модели смешанных эффектов, сравнивая в каждом условии. Вот воспроизводимый пример, моделирующий эту ситуацию с использованием пакета в :NNNYYYYYYlme4R library(lme4) fml <- "~ condition + (condition | …

1
Карет глмнет против cv.glmnet
Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с кареткой? Перекрестная проверка `glmnet` с использованием` caret` но ответа не дано, что может быть связано с …

1
ГАМ против проигрыша против сплайнов
Контекст : Я хочу , чтобы нарисовать линию в диаграмме рассеяния , что не появляется параметрическими, поэтому я использую geom_smooth()в ggplotв R. Он автоматически возвращает geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to …

2
Вывод прогноза логистической регрессии
Я создал логистическую регрессию, используя следующий код: full.model.f = lm(Ft_45 ~ ., LOG_D) base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg) step(base.model.f, scope=list(upper=full.model.f, lower=~1), direction="forward", trace=FALSE) Затем я использовал выходные данные для создания окончательной модели: final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg + AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 + Ft1_45 + IP_util_E1_m05_flg + …

2
R: функция glm со спецификацией family = «binomial» и «weight»
Меня очень смущает то, как вес работает в glm с family = "binomial". В моем понимании вероятность появления glm с family = "binomial" определяется следующим образом: где - «доля наблюдаемого успеха», а n - известное количество испытаний.е( у) = ( пп у) рп у( 1 - р )n ( 1 …

3
R: Что я вижу на графиках частичной зависимости gbm и RandomForest?
На самом деле, я думал, что понял, что можно показать на графике частичной зависимости, но на очень простом гипотетическом примере я немного озадачился. В следующем фрагменте кода я генерирую три независимые переменные ( a , b , c ) и одну зависимую переменную ( y ), где c показывает тесную …

4
Какие переменные объясняют, какие компоненты PCA, и наоборот?
Используя эти данные: head(USArrests) nrow(USArrests) Я могу сделать PCA следующим образом: plot(USArrests) otherPCA <- princomp(USArrests) Я могу получить новые компоненты в otherPCA$scores и доля дисперсии объясняется компонентами с summary(otherPCA) Но что, если я хочу знать, какие переменные в основном объясняются какими основными компонентами? И наоборот: например, ПК1 или ПК2 в …

2
Есть ли функция в R, которая берет центры кластеров, которые были найдены, и назначает кластеры для нового набора данных
У меня есть две части многомерного набора данных, давайте назовем их trainи test. И я хочу построить модель, основанную на наборе данных поезда, а затем проверить ее на наборе тестовых данных. Количество кластеров известно. Я попытался применить кластеризацию k-средних в R, и я получил объект, который содержит центры кластеров: kClust …
14 r  clustering  k-means 

3
Доверительный интервал для различия между пропорциями
Мне интересно, может ли кто-нибудь сообщить мне, правильно ли я рассчитал доверительный интервал для разницы между двумя пропорциями. Размер выборки составляет 34, из которых 19 женщин и 15 мужчин. Следовательно, разница в пропорциях составляет 0,1176471. Я рассчитываю 95% доверительный интервал для разницы между -0.1183872 и 0.3536814. Поскольку доверительный интервал проходит …

1
Что означают стрелки в биплоте PCA?
Рассмотрим следующий биплот PCA: library(mvtnorm) set.seed(1) x <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5)))) x <- scale(x, center=T, scale=F) pc <- princomp(x) biplot(pc) Есть куча красных стрелок, что они означают? Я знал, что первая стрелка, помеченная «Var1», должна указывать самое изменяющееся направление набора данных (если мы считаем их 2000 точками данных, …
14 r  pca  linear-algebra  biplot 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.