Здесь есть несколько вопросов.
(1) Модель должна быть явно вероятностной . Почти во всех случаях не будет не набор параметров , для которых л.ш. соответствует РИТ для всех ваших данных: будет невязки. Вы должны сделать предположения об этих остатках. Вы ожидаете, что они будут равны нулю в среднем? Быть симметрично распределенным? Быть примерно нормально распределенным?
Вот две модели, которые согласуются с указанной, но допускают резко отличающееся остаточное поведение (и, следовательно, обычно приводят к различным оценкам параметров). Вы можете варьировать эти модели, изменяя предположения о совместном распространении :ϵi
A: yi=β0exp(β1x1i+…+βkxki+ϵi)
B: yi=β0exp(β1x1i+…+βkxki)+ϵi.
(Обратите внимание, что это модели для данных ; обычно не существует такого понятия, как оценочное значение данных .)yiyi^
(2) Необходимость обработки нулевых значений для y подразумевает, что заявленная модель (A) является неправильной и неадекватной , поскольку она не может дать нулевое значение независимо от того, какой случайной ошибке равна. Вторая модель выше (B) допускает нулевые (или даже отрицательные) значения y. Однако не следует выбирать модель исключительно на такой основе. Повторим # 1: важно достаточно хорошо смоделировать ошибки.
(3) Линеаризация меняет модель . Как правило, это приводит к таким моделям, как (A), но не как (B). Он используется людьми, которые достаточно проанализировали свои данные, чтобы знать, что это изменение не окажет заметного влияния на оценки параметров, и людьми, которые не знают о том, что происходит. (Много раз трудно различить разницу.)
(4) Распространенный способ обработки возможности нулевого значения состоит в том, чтобы предложить (или некоторому его повторному выражению, например квадратному корню) строго положительный шанс равного нулю. Математически мы смешиваем точечную массу («дельта-функцию») с некоторым другим распределением. Эти модели выглядят так:y
f(yi)θj∼F(θ);=βj0+βj1x1i+⋯+βjkxki
где - один из параметров, неявных в векторе , - некоторое семейство параметризованных распределений by , и - это повторное выражение 's (функция "link" обобщенной линейной модели: см. ответ onetop). (Конечно, тогда = когда ) Примеры модели Пуассона и отрицательного бинома с нулевой раздувкой .PrFθ[f(Y)=0]=θj+1>0θFθ1,…,θjfyPrFθ[f(Y)≤t](1−θj+1)Fθ(t)t≠0
(5) Проблемы построения модели и ее подгонки связаны, но различны . В качестве простого примера, даже обычная регрессионная модель может быть подогнана разными способами с помощью наименьших квадратов (что дает такие же оценки параметров, как максимальное правдоподобие и почти такие же стандартные ошибки), итеративно переоцененные наименьшие квадраты , различные другие формы « надежных наименьших квадратов » и т. д. Выбор подгонки часто основан на удобстве, целесообразности ( например , наличии программного обеспечения), фамильярности, привычке или соглашении, но, по крайней мере, следует подумать с учетом того, что подходит для предполагаемого распределения условий ошибки , для чегоY=β0+β1X+ϵϵiФункция потерь для проблемы может быть разумно, и с возможностью использования дополнительной информации (например, предварительное распределение для параметров).