Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.

2
Как случайный лес генерирует случайный лес
Я не эксперт по случайным лесам, но я четко понимаю, что ключевая проблема со случайным лесом - это (случайное) генерирование деревьев. Можете ли вы объяснить мне, как создаются деревья? (т.е. что такое используемый дистрибутив для генерации дерева?) Заранее спасибо !

4
Каковы правильные значения для точности и отзыва в крайних случаях?
Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю статистический …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

5
Пост-хоккей в рамках предметных тестов?
Какой метод является предпочтительным для проведения специальных тестов для внутрисубъектных тестов? Я видел опубликованную работу, где используется HSD Тьюки, но обзор Keppel и Maxwell & Delaney предполагает, что вероятное нарушение сферичности в этих конструкциях делает ошибочный термин ошибочным, и этот подход проблематичным. Maxwell & Delaney предлагают подход к проблеме в …

2
Работает ли система Caret Train для glmnet перекрестной проверки как для альфы, так и для лямбды?
Является ли caretпакет R перекрестной проверки как для модели, так alphaи lambdaдля glmnetнее? Запуск этого кода, eGrid <- expand.grid(.alpha = (1:10) * 0.1, .lambda = (1:10) * 0.1) Control <- trainControl(method = "repeatedcv",repeats = 3,verboseIter =TRUE) netFit <- train(x =train_features, y = y_train, method = "glmnet", tuneGrid = eGrid, trControl …

4
Генерация случайных величин из смеси нормальных распределений
Как я могу сделать выборку из распределения смеси, и в частности из смеси нормальных распределений в R? Например, если я хотел сделать выборку из: 0,3× N( 0 , 1 )+0,5× N( 10 , 1 )+0.2× N( 3 , .1 )0.3×N(0,1)+0.5×N(10,1)+0.2×N(3,.1) 0.3\!\times\mathcal{N}(0,1)\; + \;0.5\!\times\mathcal{N}(10,1)\; + \;0.2\!\times\mathcal{N}(3,.1) как я мог это сделать?

3
Как интерпретировать термин перехват в GLM?
Я использую R и анализирую свои данные с помощью GLM с биноминальной ссылкой. Я хочу знать, что означает перехват в выходной таблице. Перехват для одной из моих моделей существенно отличается, однако переменная - нет. Что это значит? Что такое перехват? Я не знаю, просто ли я запутываю себя, но, обыскав …

5
Зачем беспокоиться о приближении низкого ранга?
Если у вас есть матрица с n строками и m столбцами, вы можете использовать SVD или другие методы для вычисления аппроксимации низкого ранга данной матрицы. Однако в приближении низкого ранга все равно будет n строк и m столбцов. Как могут быть использованы низкоранговые аппроксимации для машинного обучения и обработки естественного …

5
Есть ли R-функция, которая будет вычислять матрицу косинусных различий? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Я хотел бы сделать тепловую карту с кластеризацией строк на основе косинусных расстояний. Я использую R и heatmap.2()для создания фигуры. …

2
Построение доверительных интервалов для прогнозируемых вероятностей из логистической регрессии
Хорошо, у меня есть логистическая регрессия, и я использовал predict()функцию для построения кривой вероятности на основе моих оценок. ## LOGIT MODEL: library(car) mod1 = glm(factor(won) ~ as.numeric(bid), data=mydat, family=binomial(link="logit")) ## PROBABILITY CURVE: all.x <- expand.grid(won=unique(won), bid=unique(bid)) y.hat.new <- predict(mod1, newdata=all.x, type="response") plot(bid<-000:1000,predict(mod1,newdata=data.frame(bid<-c(000:1000)),type="response"), lwd=5, col="blue", type="l") Это здорово, но мне любопытно …

1
Какая польза от строки, созданной qqline () в R?
Функция qqnorm()R создает нормальный QQ-график и qqline()добавляет линию, которая проходит через первый и третий квартили. Каково происхождение этой линии? Полезно ли проверять нормальность? Это не классическая линия (диагональ возможно после линейного масштабирования).Y= хYзнак равноИксy=x Вот пример. Сначала я сравниваю эмпирическую функцию распределения с теоретической функцией распределения : теперь я строю …

2
Парный t-критерий как частный случай линейного смешанного моделирования
Мы знаем, что парное t- тестирование - это всего лишь частный случай одностороннего повторного измерения (или внутри субъекта) ANOVA, а также линейной модели смешанного эффекта, которую можно продемонстрировать с помощью функции lme () пакета nlme в R как показано ниже. #response data from 10 subjects under two conditions x1<-rnorm(10) x2<-1+rnorm(10) …

1
Непараметрический тест, если два образца взяты из одного распределения
Я хотел бы проверить гипотезу о том, что две выборки взяты из одной и той же совокупности, не делая никаких предположений о распределении выборок или совокупности. Как мне это сделать? Из Википедии у меня сложилось впечатление, что U-критерий Манна-Уитни должен быть подходящим, но на практике он мне не подходит. Для …

3
Юлия: Подводя итоги, как дела
Этот пост относится к быстро меняющемуся событию. Я столкнулся с вопросом 2012 года, в котором было очень хорошее обсуждение Джулии как альтернативы R / Python для различных типов статистических работ. Здесь лежит оригинальный вопрос 2012 года об обещании Юлии К сожалению, тогда Юлия была очень новичком, а наборы инструментов, необходимые …
19 r  python  computing  julia 

3
Смещение логистической регрессии редких событий: как смоделировать недооцененные p с минимальным примером?
У CrossValidated есть несколько вопросов о том, когда и как применять коррекцию смещения редкого события, разработанную King and Zeng (2001) . Я ищу что-то другое: минимальную демонстрацию, основанную на симуляции, которая существует. В частности, король и дзенг «... в данных по редким событиям смещения вероятностей могут быть существенно значимыми с …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.