Аддитивная ошибка или мультипликативная ошибка?

Я относительно новичок в статистике и был бы признателен за помощь в понимании этого вопроса.

В моей области есть широко используемая модель вида:

п_{T} знак равно п_{о} (В_{T})^{α}

$P_t = P_o(V_t)^\alpha$

Когда люди подгоняют модель к данным, они обычно линеаризуют ее и соответствуют следующим

журнал (п_{T}) знак равно журнал (п_{о}) + α журнал (В_{T}) + ε

$\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon$

Это нормально? Я где-то читал, что из-за шума в сигнале фактическая модель должна быть

п_{T} знак равно п_{о} (В_{T})^{α} + ε

$P_t = P_o(V_t)^\alpha + \epsilon$

и это не может быть линеаризовано, как указано выше. Это правда? Если да, кто-нибудь знает ссылку, которую я могу прочитать и узнать о ней больше, и, вероятно, привести в отчете?

— ciaran_r
источник

Я отформатировал ваши уравнения. Пожалуйста, проверьте, соответствует ли содержание тому, что вы предполагали (особенно в отношении подписчиков).

— Энди

Вы пометили свой вопрос как «ошибка измерения», и + 3 в 3-м уравнении, по-видимому, связано с аддитивной ошибкой измерения в дополнение к мультипликативной случайной / случайной вариации в ответе, что-то вроде P * (V ^ alpha) * ехр (е). Это верно? Модели ошибок измерений (также называемые моделями «ошибки в переменных») часто требуют своего рода двухэтапного процесса, который в вашем случае может потребовать отдельных данных проверки для характеристики аддитивной ошибки из-за «шума», и в этом случае может не быть нужно линеаризовать уравнение.

— N Брауэр

Какая модель подходит, зависит от того, как вариация вокруг среднего значения входит в наблюдения. Это может прийти мультипликативно или аддитивно ... или каким-то другим способом.

Может быть даже несколько источников этого изменения, некоторые из которых могут входить мультипликативно, а некоторые - аддитивно, а некоторые способами, которые на самом деле нельзя охарактеризовать как таковые.

Иногда есть четкая теория, чтобы установить, что подходит. Иногда размышления об основных источниках отклонения от среднего значения показывают соответствующий выбор. Часто люди не имеют четкого представления о том, что использовать, или если для адекватного описания процесса могут потребоваться различные источники вариаций.

С лог-линейной моделью, где используется линейная регрессия:

$\log(P_t)=log(P_o)+α\log(V_t)+ϵ$

модель регрессии OLS предполагает постоянную дисперсию логарифмического масштаба, и если это так, то исходные данные будут демонстрировать растущий разброс по среднему значению при увеличении среднего.

С другой стороны, эта модель:

$P_t=P_o(V_t)^α+ϵ$

обычно устанавливается нелинейными наименьшими квадратами, и, опять же, если установлена постоянная дисперсия (по умолчанию для NLS), то разброс вокруг среднего значения должен быть постоянным.

введите описание изображения здесь

[У вас может возникнуть визуальное впечатление, что разброс уменьшается с увеличением среднего значения на последнем изображении; на самом деле это иллюзия, вызванная увеличением наклона - мы склонны судить о распространении, ортогональном к кривой, а не по вертикали, поэтому мы получаем искаженное впечатление.]

Если у вас почти постоянный разброс либо в исходном, либо в логарифмическом масштабе, это может указывать на то, какая из двух моделей подходит, не потому, что это доказывает, что оно является аддитивным или мультипликативным, а потому, что оно приводит к надлежащему описанию как спреда, так и жадный.

Конечно, можно также иметь возможность аддитивной ошибки, которая имеет непостоянную дисперсию.

Тем не менее, существуют и другие модели, в которых можно подобрать такие функциональные отношения, которые имеют разные отношения между средним и дисперсией (например, пуассоновское или квазипуассоновское GLM, которое распространилось пропорционально квадратному корню из среднего значения).

— Glen_b - Восстановить Монику
источник