Как распределяется ошибка вокруг данных логистического роста?

В экологии мы часто используем уравнение логистического роста:

N_{t} = \frac{K N_{0} e^{r t}}{K + N_{0} e^{r t - 1}}

$N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}}$

или

N_{t} = \frac{K N_{0}}{N_{0} + (K - N_{0}) e^{- r t}}

$N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}}$

где - пропускная способность (достигнута максимальная плотность), - начальная плотность, - скорость роста, - время с начальной. $K$ $N_0$ $r$ $t$

Значение имеет мягкую верхнюю границу и нижнюю границу с сильной нижней границей в . $N_t$ $(K)$ $(N_0)$ $0$

Кроме того, в моем конкретном контексте измерения выполняются с использованием оптической плотности или флуоресценции, которые имеют теоретические максимумы и, следовательно, сильную верхнюю границу. $N_t$

Таким образом, ошибка вокруг вероятно, лучше всего описывается ограниченным распределением. $N_t$

При малых значениях распределение, вероятно, имеет сильный положительный перекос, в то время как при значениях приближающихся к K, распределение, вероятно, имеет сильный отрицательный перекос. Таким образом, распределение, вероятно, имеет параметр формы, который может быть связан с . $N_t$ $N_t$ $N_t$

Дисперсия также может увеличиваться с увеличением . $N_t$

Вот графический пример

введите описание изображения здесь

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

который может быть произведен в г с

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")

Каково будет теоретическое распределение ошибок вокруг (с учетом как модели, так и предоставленной эмпирической информации)? $N_t$
Как параметры этого распределения относятся к значению или времени (если при использовании параметров режим не может быть напрямую связан с например, logis normal)? $N_t$ $N_t$
Имеет ли это распределение функцию плотности, реализованную в ? $R$

Направления изучены до сих пор:

Предполагая нормальность вокруг (приводит к переоценке ) $N_t$ $K$
Логит нормальное распределение около , но сложность в параметров формы альфа и бета $N_t/max$
Нормальное распределение вокруг логики $N_t/max$

r distributions pdf ecology

— Этьен Лоу-Декари
источник

Сосредоточив внимание на распределении ошибок, этот вопрос отражает сложное мышление о модели, но обратите внимание, что распределение ошибок для функциональной формы не обязательно имеет какое-либо отношение к самой форме. Компоненты правильного ответа вместо этого можно найти в информации о том, как происходит рост, о естественных изменениях и во времени (которые обязательно будут учтены в ошибке), о возможной неправильной спецификации модели и о том, как ( и ) измеряются.

K

$K$

r

$r$

N_{t}

$N_t$

t

$t$

— whuber

@whuber, я пытался ответить на некоторые из ваших комментариев в недавнем редактировании.

— Этьен Лоу-Декари,

Думаю, что если вы можете охарактеризовать свойства распределения шума так, как вы это делаете, вы можете выбрать параметрическую форму с этими свойствами. Я думаю, что для суммирования семейства необходимо: 1. быть определенным на конечном интервале, 2. разрешить перекос влево, перекос вправо и симметрию. и 3. имеет дисперсию, которая увеличивается с увеличением Nt. Бета-распределение соответствует требованиям для 1 и 2. Фиксированный интервал равен [0, 1]. Таким образом, чтобы допустить увеличение дисперсии, мы могли бы добавить параметр c, который распространяет распределение в intervsl [0, c].

— Майкл Р. Черник

Ответы:

Как отметил Майкл Черник, для этого лучше всего подходит масштабная бета-версия. Тем не менее, для всех практических целей, и ожидая, что вы никогда не будетеЧтобы получить правильную модель, вам лучше всего просто моделировать среднее значение с помощью нелинейной регрессии в соответствии с вашим уравнением логистического роста и включать в него стандартные ошибки, устойчивые к гетероскедастичности. Включение этого в контекст максимального правдоподобия создаст ложное чувство высокой точности. Если экологическая теория создаст распределение, вы должны соответствовать этому распределению. Если ваша теория только дает предсказание для среднего, вы должны придерживаться этой интерпретации и не пытаться придумать что-то большее, например, полномасштабное распределение. (Система кривых Пирсона была определенно причудливой 100 лет назад, но случайные процессы не следуют дифференциальным уравнениям для получения кривых плотности, что было его мотивацией с этими кривыми плотности - скорее, $N_t$ себе - я думаю о распределении Пуассона в качестве примера - и я не совсем уверен, что этот эффект будет отражен в масштабном бета-распределении; напротив, оно будет сжиматься, когда вы тянете среднее к его теоретической верхней границе, что вам, возможно, придется сделать. Если ваше измерительное устройство имеет верхнюю границу измерений, это не означает, что ваш фактический процессдолжен иметь верхнюю границу; Я бы скорее сказал, что ошибка измерения, вносимая вашими устройствами, становится критической, так как процесс достигает этой верхней границы при измерении достаточно точно. Если вы путаете измерение с базовым процессом, вы должны признать это явно, но я думаю, что вы заинтересованы в этом процессе больше, чем в описании работы вашего устройства. (Процесс начнется через 10 лет; могут появиться новые измерительные приборы, поэтому ваша работа устареет.)

— Stask
источник

Огромное спасибо! Я согласен, что разделение процесса и меры интересно. Я, однако, предположил бы, что большинство методов измерения имеют эту сильную верхнюю границу, но может быть важно выделить это. Если я буду использовать масштабированную бета-версию, несмотря на ваше предупреждение о достоверности подбора MLE, есть какие-либо предложения относительно того, как связать параметры формы с этой системой с переменными модели, чтобы учесть MLE?

— Этьен Лоу-Декари

Если вы уверены, что ваши границы действительно важны для вашего приложения, вы можете просто придерживаться этой масштабной бета-версии. Все, что я говорю, это то, что я не убежден. Существуют модели для усеченных данных, где все, что вы знаете, это то, что фактическое значение превышает максимально возможное значение; иногда они используются вместе с верхним кодированием доходов, тогда как по соображениям конфиденциальности доходы, превышающие, скажем, 100 000 долларов США в год, сокращаются до 100 000 долларов США в год.

— StasK

@whuber правильно, что нет необходимой связи структурной части этой модели с распределением ошибок. Таким образом, нет ответа на ваш вопрос для теоретического распределения ошибок.

Это не значит, что это не очень хороший вопрос - просто ответ должен быть в основном эмпирическим.

Вы, кажется, предполагаете, что случайность аддитивна. Я не вижу никакой причины (кроме удобства вычислений), чтобы это имело место. Есть ли альтернатива, что в модели есть случайный элемент? Например, см. Ниже, где случайность представлена как Нормально распределенная со средним значением 1, дисперсия - единственное, что нужно оценить. У меня нет оснований думать, что это правильная вещь, кроме того, что она дает правдоподобные результаты, которые, кажется, соответствуют тому, что вы хотите увидеть. Было бы целесообразно использовать что-то подобное в качестве основы для оценки модели, я не знаю.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

введите описание изображения здесь

— Питер Эллис
источник

В этом случае вы можете иметь значения Nt ниже нуля и выше твердой верхней границы. Кроме того, ожидается шум во всех параметрах (не обязательно в произведении параметра со временем), следовательно, шум в переменной отклика. Я все еще был бы заинтересован в максимальной вероятности интерпретации вашего подхода.

— Этьен Лоу-Декари

Это не позволяет распределению быть ограниченным для каждого Nt и не допускает перекоса компонента шума. Я не знаю, использовалась ли моя идея масштабного бета-дистрибутива в литературе, но она хорошо удовлетворяет ограничениям. Я не пробовал это, но возможно максимальная вероятность могла быть испробована. Я не уверен, но, возможно, возникнет проблема, если c будет включен в оценку вероятности. Может быть, с можно было бы оценить отдельно, основываясь только на Nt, и тогда оставшуюся часть модели можно было бы подобрать по максимальной вероятности для каждого фиксированного Nt.

— Майкл Р. Черник

Я просто думаю вслух. Кто-нибудь думает, что эту проблему можно превратить в хорошую исследовательскую работу?

— Майкл Р. Черник

Бумага 1966 года действительно немного разбиралась в этом, однако я не видел ни одного более свежего. Может, с тех пор все изменилось? jstor.org/discover/10.2307/…

— Этьен Лоу-Декари

Пожалуйста, дайте мне знать, если вы решите пойти по этому пути.

— Этьен Лоу-Декари