Квадратный корень приблизительно стабилизирует дисперсию для Пуассона . Существует целый ряд вариантов квадратного корня, которые улучшают свойства, такие как добавление38 перед извлечением квадратного корня или Freeman-Tukey ( - хотя это часто корректируется и на среднее значение).X−−√+X+1−−−−−√
Преобразование квадратного корня несколько улучшает симметрию - хотя и не так хорошо, как степень [1]:23
Если вы особенно хотите почти нормальность (пока параметр Пуассона не очень мал) и не заботитесь о / можете приспособиться к гетероскедастичности, попробуйте power.23
Каноническая связь обычно не является особенно хорошим преобразованием для данных Пуассона ; лог ноль - это особая проблема (другая - гетероскедастичность; вы также можете получить асимметрию влево, даже если у вас нет нулей). Если наименьшие значения не слишком близки к 0, это может быть полезно для линеаризации среднего значения. Это хорошая «трансформация» для условного среднего по Пуассону в ряде контекстов, но не всегда по пуассоновским данным. Однако, если вы хотите преобразовать, одной из распространенных стратегий является добавление константы которая позволяет избежать проблемы . В таком случае мы должны рассмотреть, какую константу добавить. Не отходя слишком далеко от рассматриваемого вопроса, значения междуy∗=log(y+c)0c0.4и работают очень хорошо (например, в отношении смещения в оценке наклона) в диапазоне значений . Я обычно просто использую так как это просто, со значениями около часто немного лучше.0.5μ120.43
Что касается того, почему люди выбирают одно преобразование другому (или ни одного) - это действительно вопрос того, что они делают, чтобы добиться этого.
[1]: Сюжеты, созданные по образцу сюжетов Хенрика Бенгтссона в его раздаточном материале «Обобщенные линейные модели и преобразованные остатки», см. Здесь
(см. Первый слайд на стр. 4). Я добавил немного y-дрожания и пропустил строки.