При подборе кривой, как рассчитать 95% доверительный интервал для моих подогнанных параметров?

Я подгоняю кривые к своим данным, чтобы извлечь один параметр. Однако я не уверен, какова достоверность этого параметра и как я рассчитал бы / выразил его % доверительный интервал. $95$

Скажем, для набора данных, содержащего данные, которые экспоненциально распадаются, я подгоняю кривую к каждому набору данных. Тогда информация, которую я хочу извлечь, является показателем степени . Я знаю значения и значение меня не интересует (это переменная, которая исходит от населения, а не от процесса, который я пытаюсь смоделировать). $b$ $t$ $a$

Я использую нелинейную регрессию, чтобы соответствовать этим параметрам. Однако я не знаю, как рассчитать % доверительный интервал для любого метода, поэтому приветствуются и более широкие ответы. $95$

f = a \cdot e^{- b t}

$f= a\cdot e^{-bt}$ $пример данных и подгонка$

Как только я получу значение , как рассчитать % доверительный интервал? Заранее спасибо! $b$ $95$

confidence-interval nonlinear-regression fitting

— Лео
источник

Как вы подходите данные? Ваша функция преобразована так, чтобы соответствовать OLS?

— Джонни

Из ваших комментариев по ответам я вижу, что вы на самом деле делаете нелинейные наименьшие квадраты. У вас были бы хорошие ответы быстрее, если бы вы начали с этой информации. Я, по крайней мере, добавил соответствующий тег.

— Glen_b

@Glen_b Ах, я буду более полон в будущем и добавлю это к вопросу. Я думал о том, однако. В некоторых наборах данных я использую абсолютное расстояние L1, а в других случаях все еще использую линейную регрессию. Поэтому я надеялся получить широкий ответ.

— Лев

Если вы хотите получить ответы для наименьших квадратов, регрессии L1 и нелинейных наименьших квадратов, лучше всего об этом прямо заявить.

— Glen_b

Ответы:

Проблема с линеаризацией и последующим использованием линейной регрессии заключается в том, что предположение о гауссовском распределении невязок вряд ли будет верным для преобразованных данных.

Обычно лучше использовать нелинейную регрессию. Большинство программ нелинейной регрессии сообщают о стандартной ошибке и доверительном интервале наиболее подходящих параметров. Если у вас нет, эти уравнения могут помочь.

Каждая стандартная ошибка вычисляется с использованием этого уравнения:

SE(Pi) = sqrt[ (SS/DF) * Cov(i,i) ]

Pi: i-й регулируемый (непостоянный) параметр
SS: сумма квадратов невязок
DF: степени свободы (количество точек данных минус число параметров, подходящих по регрессии)
Cov (i, i): i-й диагональный элемент ковариационной матрицы
sqrt (): квадратный корень

А вот уравнение для вычисления доверительного интервала для каждого параметра из наилучшего значения, его стандартной ошибки и количества степеней свободы.

From [BestFit(Pi)- t(95%,DF)*SE(Pi)]  TO  [BestFit(Pi)+
 t(95%,DF)*SE(Pi)]

BestFit (Pi) - наилучшее значение для i-го параметра
t - это значение из распределения t для 95% достоверности для указанного количества DF.
DF - это степени свободы.

Пример с Excel для 95% достоверности (т. Е. Альфа = 0,05) и 23 степеней свободы: = TINV (0,05,23) DF равняется степеням свободы (количество точек данных минус число параметров, подходящих по регрессии)

— Харви Мотульский
источник

Это именно то, что мне было нужно, спасибо! Я использовал lsqcurvefit в Matlab , он не выводит доверительный интервал или стандартную ошибку. Он дает множители Лагранжа (?), Невязки и возведенную в квадрат 2-норму невязок. Теперь с этим и вашим ответом я могу рассчитать, что мне нужно!

— Лев

Если вы считаете, что подходящей моделью для ваших данных является:

$f = ae^{-bt}$

Затем вы можете взять журнал преобразовать ваши данные ответа так, чтобы подходящая модель была:

$f' = a' -bt$

$f' = ln(f)$ $a' = ln(a)$

# Rough simulated data set.
set.seed(1)
a <- 50; b <- 0.2; n <- 25
x <- 1:n
y <- a*(exp(-b * x))
y <- y + rnorm(n, sd=0.25)
y <- ifelse(y>0, y, 0.1)
plot(x,y)

# Linearise:
y2 <- log(y)
plot(x,y2)

# Fit model to transformed data
model <- lm(y2 ~ x)
summary(model)
confint(model)

# Or:
param <- summary(model)$coefficients[, 1]; se <- summary(model)$coefficients[, 2]
param + qt(0.975, 23) * se
param - qt(0.975, 23) * se

$~N(0,\sigma^2)$

— т-студент
источник

Ах, спасибо! Очень хороший и полный ответ! Это я могу использовать, если я делаю линеаризованную подгонку, что я иногда делаю. Я надеюсь, что вы не возражаете, что я принимаю ответ Харвиса, так как в этом случае мой вопрос был не о линеаризованном подходе. Тем не менее, полезный ответ!

— Лев