Вопросы с тегом «prediction»

Прогнозирование неизвестных случайных величин с использованием статистической модели.

1
Случайный лес и прогноз
Я пытаюсь понять, как работает Random Forest. У меня есть представление о том, как строятся деревья, но я не могу понять, как Random Forest делает прогнозы на выборке из сумки. Может ли кто-нибудь дать мне простое объяснение, пожалуйста? :)

1
Прогнозирование на моделях со смешанным эффектом: что делать со случайными эффектами?
Давайте рассмотрим этот гипотетический набор данных: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) мы можем использовать lmeдля моделирования ответа с моделью случайного эффекта: require(nlme) model <- …

3
Прогнозирование данных счета со случайным лесом
Можно ли обучить Случайный Лес для правильного прогнозирования данных счета? Как это будет продолжаться? У меня довольно широкий диапазон значений, поэтому классификация не имеет смысла. Если бы я использовал регрессию, я бы просто усек результат? Я совершенно потерян здесь. Есть идеи?

1
Точный критерий Фишера и гипергеометрическое распределение
Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст …

1
Требуется ли предварительная обработка перед прогнозированием с использованием FinalModel из RandomForest с пакетом Caret?
Я использую пакет caret для обучения объекта randomForest с 10x10CV. library(caret) tc <- trainControl("repeatedcv", number=10, repeats=10, classProbs=TRUE, savePred=T) RFFit <- train(Defect ~., data=trainingSet, method="rf", trControl=tc, preProc=c("center", "scale")) После этого я тестирую randomForest на testSet (новые данные) RF.testSet$Prediction <- predict(RFFit, newdata=testSet) Матрица путаницы показывает мне, что модель не так уж и …

1
Почему Netflix переключился бы со своей пятизвездочной рейтинговой системы на систему «нравится / не нравится»?
Netflix использовал свои предложения на основе предоставленных пользователем оценок других фильмов / шоу. Эта рейтинговая система имела пять звезд. Теперь Netflix позволяет пользователям нравится / не нравится (большие пальцы вверх / вниз) фильмы / шоу. Они утверждают, что фильмы легче оценивать. Разве эта двухсторонняя классификация не будет статистически менее предсказательной, …

1
Интервал прогнозирования = вероятный интервал?
Мне интересно, если интервал прогнозирования и вероятный интервал оценивают одно и то же. Например, при линейной регрессии, когда вы оцениваете интервал прогнозирования подобранных значений, вы оцениваете пределов интервала, в котором вы ожидаете, что ваше значение упадет. В противоположность доверительному интервалу вы фокусируете внимание не на параметре распределения, таком как среднее …

1
R neuralnet - вычислить, дать постоянный ответ
Я пытаюсь использовать neuralnetпакет R (документация здесь ) для прогноза. Вот что я пытаюсь сделать: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse = ' + '))) …

1
Выбор модели ABC
Было показано, что выбор модели ABC с использованием байесовских факторов не рекомендуется из-за наличия ошибки, связанной с использованием сводной статистики. Заключение в этой статье основано на изучении поведения популярного метода аппроксимации байесовского фактора (алгоритм 2). Хорошо известно, что байесовские факторы - не единственный способ выбора модели. Существуют и другие функции, …

2
Интервалы прогнозирования и толерантности
У меня есть пара вопросов для прогнозирования и интервалов терпимости. Давайте сначала договоримся об определении интервалов толерантности: нам дают уровень достоверности, скажем, 90%, процент населения, подлежащего отбору, скажем, 99%, и размер выборки, скажем, 20. Распределение вероятностей известно, скажем, нормально для удобства. Теперь, учитывая вышеприведенные три числа (90%, 99% и 20) …

1
R / mgcv: Почему тензорные продукты te () и ti () производят разные поверхности?
mgcvПакет Rимеет две функции для установки взаимодействия Тензор продукта: te()и ti(). Я понимаю основное разделение труда между ними (подгонка нелинейного взаимодействия против разложения этого взаимодействия на основные эффекты и взаимодействие). Чего я не понимаю, так это почему te(x1, x2)и ti(x1) + ti(x2) + ti(x1, x2)может дать (немного) разные результаты. MWE …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
Как рассчитать доверительные оценки в регрессии (со случайными лесами / XGBoost) для каждого прогноза в R?
Есть ли способ получить показатель достоверности (мы можем также назвать его значением достоверности или вероятности) для каждого прогнозируемого значения при использовании таких алгоритмов, как Random Forests или Extreme Gradient Boosting (XGBoost)? Допустим, этот показатель доверия будет варьироваться от 0 до 1 и покажет, насколько я уверен в том или ином …

1
Прогнозирование со случайными эффектами в MGCV GAM
Я заинтересован в моделировании общего вылова рыбы с использованием gam в mgcv для моделирования простых случайных эффектов для отдельных судов (которые совершают многократные поездки во время промысла). У меня 98 предметов, поэтому я решил использовать гамму вместо гамма для моделирования случайных эффектов. Моя модель: modelGOM <- gam(TotalFish ~ factor(SetYear) + …

2
Какова связь между причинным выводом и предсказанием?
Каковы взаимосвязи и различия между причинным выводом и предсказанием (как классификация, так и регрессия)? В контексте прогнозирования у нас есть переменные предиктор / вход и переменные ответ / выход. Означает ли это, что существует причинно-следственная связь между входными и выходными переменными? Итак, относится ли предсказание к причинному выводу? Если я …

2
«Значимая переменная», которая не улучшает прогнозирование вне выборки - как интерпретировать?
У меня есть вопрос, который, я думаю, будет довольно простым для многих пользователей. Я использую модели линейной регрессии для (i) исследования взаимосвязи нескольких объясняющих переменных и моей переменной отклика и (ii) прогнозирования моей переменной отклика с использованием объяснительных переменных. Одна конкретная объясняющая переменная X, по-видимому, существенно влияет на мою переменную …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.