Некоторые называют это « начальным логарифмом » ( например , Джоном Тьюки). (Для некоторых примеров Google Джон Тьюки «начал журнал» .)
Это прекрасно в использовании. Фактически, вы могли бы ожидать, что для учета округления зависимой переменной нужно использовать ненулевое начальное значение. Например, округление зависимой переменной до ближайшего целого числа эффективно отсекает 1/12 от ее истинной дисперсии, предполагая, что разумное начальное значение должно быть не менее 1/12. (Это значение не делает плохую работу с этими данными. Использование других значений выше 1 на самом деле не сильно меняет картину; оно просто повышает все значения в правом нижнем графике почти равномерно.)
Существуют более глубокие причины использовать логарифм (или начальный журнал) для оценки отклонения: например, наклон графика отклонения от оценочного значения в шкале лог-журнала оценивает параметр Бокса-Кокса для стабилизации дисперсии . Такие степенные подгонки дисперсии к некоторой связанной переменной часто наблюдаются. (Это эмпирическое утверждение, а не теоретическое.)
Если ваша цель - представить отклонения, действуйте осторожно. Многие аудитории (кроме научных) не могут понять логарифм, тем более начальный. Использование начального значения 1 как минимум имеет преимущество в том, что его немного проще объяснить и интерпретировать, чем в каком-либо другом начальном значении. Что-то, чтобы рассмотреть, состоит в том, чтобы построить их корни, которые являются стандартными отклонениями, конечно. Это будет выглядеть примерно так:
Независимо от того, если ваша цель состоит в том, чтобы исследовать данные, учиться на них, подбирать модель или оценивать модель, то не позволяйте ничему мешать найти разумное графическое представление ваших данных и полученных из данных значений. такие как эти отклонения.