Статистика и большие данные r

2

Как построить границу решения в R для модели логистической регрессии?

Я сделал модель логистической регрессии, используя glm в R. У меня есть две независимые переменные. Как я могу построить границу решения моей модели на графике рассеяния двух переменных. Например, как я могу нарисовать фигуру, например: http://onlinecourses.science.psu.edu/stat557/node/55 Благодарю.

16 r logistic

3

Каким образом прогнозируемые вероятности класса `gnett.randomForest` оценивают?

Как randomForestпакет оценивает вероятности класса, когда я использую predict(model, data, type = "prob")? Я использовал rangerдля обучения случайных лесов, используя probability = Tаргумент для прогнозирования вероятностей. rangerв документации сказано что это: Вырастите лес вероятности, как в Malley et al. (2012). Я смоделировал некоторые данные и попробовал оба пакета и получил …

16 r random-forest prediction

3

Использование glm () вместо простого теста хи-квадрат

Я заинтересован в изменении нулевых гипотез, используя glm()в R. Например: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) проверяет гипотезу, что . Что если я захочу изменить значение null на = какое-то произвольное значение внутри ? рр = 0,5пзнак равно0,5p = 0.5ппpglm() Я знаю, что это можно …

15 r hypothesis-testing generalized-linear-model chi-squared offset

1

Как подобрать смешанную модель с переменной отклика от 0 до 1?

Я пытаюсь использовать lme4::glmer()для подгонки биномиальной обобщенной смешанной модели (GLMM) с зависимой переменной, которая является не двоичной, а непрерывной переменной от нуля до единицы. Можно думать об этой переменной как о вероятности; на самом деле это вероятность того, как сообщили человеческих субъектов (в эксперименте , который я помочь анализирующего). Т.е. …

15 r logistic mixed-model glmm lme4-nlme

1

Написание математического уравнения для многоуровневой модели смешанных эффектов

Вопрос CV Я пытаюсь дать (а) подробное и краткое математическое представление (я) модели смешанных эффектов. Я использую lme4пакет в R. Каково правильное математическое представление для моей модели? Данные, научный вопрос и код R Мой набор данных состоит из видов в разных регионах. Я проверяю, изменяется ли распространенность вида во время, …

15 r mixed-model multilevel-analysis lme4-nlme

4

Точность градиентной машины уменьшается с увеличением числа итераций

Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

2

Предсказания от модели BSTS (в R) полностью проваливаются

Прочитав этот пост в блоге о байесовских моделях структурных временных рядов, я хотел взглянуть на реализацию этого в контексте проблемы, для которой я ранее использовал ARIMA. У меня есть некоторые данные с некоторыми известными (но шумными) сезонными компонентами - это определенно есть ежегодные, ежемесячные и еженедельные компоненты, а также некоторые …

15 r time-series bayesian mcmc bsts

1

Понимание QR-разложения

У меня есть рабочий пример (в R), который я пытаюсь понять дальше. Я использую Limma для создания линейной модели, и я пытаюсь понять, что происходит шаг за шагом в вычислениях кратного изменения. Я в основном пытаюсь выяснить, что происходит для расчета коэффициентов. Из того, что я могу выяснить, QR-декомпозиция используется …

15 r regression linear-model

1

Использует ли случайный лес Бреймана прирост информации или индекс Джини?

Я хотел бы знать, использует ли случайный лес Бреймана (случайный лес в пакете R randomForest) в качестве критерия расщепления (критерий для выбора атрибута) получение информации или индекс Джини? Я пытался выяснить это на http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm и в документации для пакета randomForest в R. Но единственное, что я обнаружил, это то, что …

15 r random-forest entropy gini

2

Как подобрать модель смеси для кластеризации

У меня есть две переменные - X и Y, и мне нужно сделать кластер максимальным (и оптимальным) = 5. Давайте идеальный график переменных выглядит следующим образом: Я хотел бы сделать 5 кластеров из этого. Что-то вроде этого: Таким образом, я думаю, что это смешанная модель с 5 кластерами. Каждый кластер …

15 r clustering gaussian-mixture

2

Расчет АПК «вручную» в R

Я попытался вычислить AIC линейной регрессии в R, но без использования AICфункции, например: lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 Тем не менее, AICдает другое значение: AIC(lm_mtcars) [1] 190.7999 Может кто-нибудь сказать мне, что я делаю не так?

15 r aic information-theory

1

Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования непараметрическое тестирование, как, Mann-Whitney-U-testможет привести к потере большего количества информации. Тем не менее, одно и только одно предположение …

15 hypothesis-testing permutation-test exchangeability r statistical-significance loess data-visualization normal-distribution pdf ggplot2 kernel-smoothing probability self-study expected-value normal-distribution prior correlation time-series regression heteroscedasticity estimation estimators fisher-information data-visualization repeated-measures binary-data panel-data mathematical-statistics coefficient-of-variation normal-distribution order-statistics regression machine-learning one-class probability estimators forecasting prediction validation finance measurement-error variance mean spatial monte-carlo data-visualization boxplot sampling uniform chi-squared goodness-of-fit probability mixture theory gaussian-mixture regression statistical-significance p-value bootstrap regression multicollinearity correlation r poisson-distribution survival regression categorical-data ordinal-data ordered-logit regression interaction time-series machine-learning forecasting cross-validation binomial multiple-comparisons simulation false-discovery-rate r clustering frequency wilcoxon-mann-whitney wilcoxon-signed-rank r svm t-test missing-data excel r numerical-integration r random-variable lme4-nlme mixed-model weighted-regression power-law errors-in-variables machine-learning classification entropy information-theory mutual-information

1

Интерпретация переменных трассировок LASSO

Я новичок в glmnetпакете, и я все еще не уверен, как интерпретировать результаты. Может ли кто-нибудь помочь мне прочитать следующий сюжет трассировки? График был получен путем запуска следующего: library(glmnet) return <- matrix(ret.ff.zoo[which(index(ret.ff.zoo)==beta.df$date[2]), ]) data <- matrix(unlist(beta.df[which(beta.df$date==beta.df$date[2]), ][ ,-1]), ncol=num.factors) model <- cv.glmnet(data, return, standardize=TRUE) op <- par(mfrow=c(1, 2)) plot(model$glmnet.fit, "norm", …

15 r data-visualization interpretation lasso glmnet

1

Как интерпретировать коэффициенты из бета-регрессии?

У меня есть некоторые данные, которые ограничены между 0 и 1. Я использовал betaregпакет в R, чтобы подогнать регрессионную модель с ограниченными данными в качестве зависимой переменной. У меня вопрос: как мне интерпретировать коэффициенты из регрессии?

15 r regression interpretation beta-distribution regression-coefficients

5

Генерация нормально распределенных случайных чисел с неположительно определенной ковариационной матрицей

Я оценил образец ковариационной матрицы образца и получил симметричную матрицу. С , я хотел бы создать -мерного нормальный распределенный гп , но поэтому мне нужно разложение Холецкого . Что мне делать, если не является положительно определенным?C n C CССCССCNNnССCССC

15 r random-generation covariance-matrix multivariate-normal cholesky

Вопросы с тегом «r»