В этой статье под названием «ВЫБОР СРЕДИ ОБОБЩЕННЫХ ЛИНЕЙНЫХ МОДЕЛЕЙ, ПРИМЕНЯЕМЫХ К МЕДИЦИНСКИМ ДАННЫМ» авторы пишут:
В обобщенной линейной модели среднее значение преобразуется функцией связи вместо преобразования самого отклика. Два метода преобразования могут привести к совершенно разным результатам; например, среднее значение логарифмически преобразованных ответов не совпадает с логарифмом среднего ответа . В целом, первое не может быть легко преобразовано в средний ответ. Таким образом, преобразование среднего значения часто позволяет легче интерпретировать результаты, особенно в том смысле, что средние параметры остаются в том же масштабе, что и измеренные отклики.
Похоже, что они советуют подгонять обобщенную линейную модель (GLM) с логарифмической связью вместо линейной модели (LM) с лог-преобразованным откликом. Я не понимаю преимуществ этого подхода, и он кажется мне довольно необычным.
Моя переменная ответа выглядит нормально распределенной по журналу. Я получаю схожие результаты с точки зрения коэффициентов и их стандартных ошибок при любом подходе.
Тем не менее, мне интересно: если переменная имеет лог-нормальное распределение, не является ли среднее значение лог-преобразованной переменной предпочтительным по сравнению с логарифмом средней нетрансформированной переменной , так как среднее является естественной суммой нормального распределения и журнала -трансформированная переменная нормально распределена, тогда как сама переменная нет?