Вопросы с тегом «fitting»

Процесс согласования некоторой статистической модели с определенным набором данных. В основном это делается на компьютере и с использованием различных численных методов, таких как оптимизация или численная интеграция или моделирование.

3
R: Случайный лес, выбрасывающий NaN / Inf в ошибке «вызова сторонней функции», несмотря на отсутствие NaN в наборе данных [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 2 года назад . Я использую каретку, чтобы запустить перекрестный проверенный случайный лес по набору данных. Переменная Y является фактором. В моем наборе данных …

6
Подгонка синусоидального термина к данным
Хотя я читаю этот пост, я все еще не знаю, как применить это к моим собственным данным, и надеюсь, что кто-то может мне помочь. У меня есть следующие данные: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, …
26 r  regression  fitting 

1
Обнаружение выбросов в данных подсчета
У меня есть то, что я наивно думал, что это довольно прямая проблема, которая включает в себя обнаружение выбросов для множества различных наборов данных подсчета. В частности, я хочу определить, является ли одно или несколько значений в серии данных подсчета выше или ниже ожидаемого по сравнению с остальными подсчетами в …

1
Когда имеется аналитический якобиан, лучше ли аппроксимировать гессиан или конечными разностями якобиана?
Допустим, я вычисляю некоторые параметры модели, минимизирую сумму квадратов невязок и предполагаю, что мои ошибки гауссовские. Моя модель производит аналитические производные, поэтому оптимизатору не нужно использовать конечные различия. После завершения подгонки я хочу вычислить стандартные ошибки подгоночных параметров. Как правило, в этой ситуации гессиан функции ошибки считается связанным с ковариационной …

1
MLE против наименьших квадратов в подходящих распределениях вероятностей
На основании нескольких статей, книг и статей, которые я прочитал, у меня сложилось впечатление, что рекомендуемый способ подбора распределения вероятностей для набора данных - использование оценки максимального правдоподобия (MLE). Тем не менее, как физик, более интуитивный способ состоит в том, чтобы просто подогнать PDF модели к эмпирическому PDF данных, используя …

2
Разница между регрессионным анализом и подгонкой кривой
Кто-нибудь может объяснить мне реальные различия между регрессионным анализом и подгонкой кривой (линейной и нелинейной), с примером, если это возможно? Кажется, что оба пытаются найти связь между двумя переменными (зависимыми и независимыми), а затем определяют параметр (или коэффициент), связанный с предлагаемыми моделями. Например, если у меня есть набор данных, таких …

3
Т-распределение Фиттинга в R: параметр масштабирования
Как мне подобрать параметры t-распределения, то есть параметры, соответствующие «среднему» и «стандартному отклонению» нормального распределения. Я предполагаю, что они называются «среднее» и «масштабирование / степени свободы» для t-распределения? Следующий код часто приводит к ошибкам «сбой оптимизации». library(MASS) fitdistr(x, "t") Нужно ли сначала масштабировать х или преобразовать в вероятности? Как лучше …

4
Точность градиентной машины уменьшается с увеличением числа итераций
Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
Почему в линейной регрессии используется функция стоимости, основанная на вертикальном расстоянии между гипотезой и точкой входных данных?
Допустим, у нас есть входные (предикторные) и выходные (ответные) точки данных A, B, C, D, E, и мы хотим провести линию через точки. Это простая проблема для иллюстрации вопроса, но она может быть распространена и на более высокие измерения. Постановка задачи Текущее наилучшее соответствие или гипотеза представлена черной линией выше. …

3
Как программно определить сегменты ряда данных, чтобы они соответствовали различным кривым?
Существуют ли какие-либо документированные алгоритмы для разделения разделов данного набора данных на различные кривые наилучшего соответствия? Например, большинство людей, смотрящих на эту таблицу данных, с готовностью разделят ее на 3 части: синусоидальный сегмент, линейный сегмент и обратный экспоненциальный сегмент. Фактически, я сделал этот конкретный с синусоидой, линией и простой экспоненциальной …

3
Можно ли использовать тест Колмогорова-Смирнова и оценить параметры распределения?
Я читал, что критерий Колмогорова-Смирнова не должен использоваться для проверки правильности соответствия распределения, параметры которого были оценены по выборке. Имеет ли смысл разделить мою выборку на две части и использовать первую половину для оценки параметров, а вторую - для теста KS? заранее спасибо

1
Как минимизировать остаточную сумму квадратов экспоненциальной подгонки?
У меня есть следующие данные, и я хотел бы приспособить к ним модель отрицательного экспоненциального роста: Days <- c( 1,5,12,16,22,27,36,43) Emissions <- c( 936.76, 1458.68, 1787.23, 1840.04, 1928.97, 1963.63, 1965.37, 1985.71) plot(Days, Emissions) fit <- nls(Emissions ~ a* (1-exp(-b*Days)), start = list(a = 2000, b = 0.55)) curve((y = 1882 …

3
Как я могу подогнать сплайн к данным, которые содержат значения и 1/2 производные?
У меня есть набор данных, который содержит, скажем, некоторые измерения для положения, скорости и ускорения. Все приходят от одного и того же «бега». Я мог бы построить линейную систему и подогнать полином для всех этих измерений. Но могу ли я сделать то же самое со сплайнами? Что такое способ «R»? …

1
Почему среднее арифметическое меньше среднего по логарифмически нормальному распределению?
Итак, у меня есть случайный процесс генерирования лог-нормально распределенных случайных величин . Вот соответствующая функция плотности вероятности:XXX Я хотел оценить распределение нескольких моментов этого исходного распределения, скажем, 1-го момента: среднее арифметическое. Для этого 10000 раз я нарисовал 100 случайных величин, чтобы вычислить 10000 оценок среднего арифметического. Есть два разных способа …

2
ARIMA против ARMA на дифференцированной серии
В R (2.15.2) я однажды установил ARIMA (3,1,3) для временного ряда и один раз ARMA (3,3) для разностных временных рядов. Установленные параметры отличаются, что я приписал методу подбора в ARIMA. Кроме того, подгонка ARIMA (3,0,3) к тем же данным, что и ARMA (3,3), не приведет к идентичным параметрам, независимо от …
13 r  time-series  arima  fitting  arma 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.