Вы цитируете несколько советов, каждый из которых, без сомнения, предназначен для нас, но в них трудно найти много достоинств.
В каждом случае я полностью полагаюсь на то, что вы приводите в качестве резюме. В защиту авторов я хотел бы полагать, что они добавляют соответствующие квалификации в окружающий или другой материал. (Полные библиографические ссылки в обычном (ых) названии (ах), дате, названии, (издатель, место) или (название журнала, том, страницы) улучшат этот вопрос.)
поле
Этот совет полезен, но в лучшем случае значительно упрощен. Совет Филда, кажется, предназначен вообще; Например, ссылка на тест Левена подразумевает некоторую временную сосредоточенность на анализе отклонений.
Например, предположим, у меня есть один предиктор, который по разным причинам должен быть зарегистрирован, и другая переменная индикатора, которая . Последний (а) не может быть зарегистрирован (б) не должен быть зарегистрирован. (Действительно, любое преобразование индикаторной переменной в любые два различных значения не имеет важного эффекта.)( 1 , 0 )
В целом, во многих областях обычная ситуация - это то, что некоторые предикторы должны быть преобразованы, а остальные оставлены как есть.
Это правда, что столкновение в статье или диссертации смеси трансформаций, применяемых по-разному к разным предикторам (в том числе как частный случай, трансформация идентичности или оставление как есть), часто вызывает беспокойство у читателя. Является ли смесь хорошо продуманным выбором или она была произвольной и капризной?
Кроме того, в серии исследований согласованность подхода (всегда применяя логарифмы к ответу или никогда не делая этого) действительно очень помогает при сравнении результатов, а другой подход делает его более трудным.
Но это не значит, что никогда не может быть причин для сочетания преобразований.
Я не вижу, что большая часть цитируемого вами раздела имеет большое значение для ключевого совета, который вы выделите желтым цветом. Это само по себе вызывает беспокойство: странно объявлять абсолютное правило, а потом не объяснять его. И наоборот, предписание «Помни» предполагает, что основания Филда были указаны ранее в книге.
Анонимная бумага
Контекст здесь - регрессионные модели. Как часто разговоры об OLS странным образом подчеркивают метод оценки, а не модель, но мы можем понять, что предполагается. GWR я рассматриваю как географически взвешенную регрессию.
Аргумент здесь заключается в том, что вы должны преобразовать ненормальные предикторы и оставить другие как есть. Опять же, возникает вопрос о том, что вы можете и должны делать с переменными индикатора, которые не могут быть нормально распределены (на что, как указано выше, можно ответить, указав, что ненормальность в этом случае не является проблемой). Но судебный запрет имеет обратную сторону, подразумевая, что проблема заключается в ненормальности предикторов. Не так; регрессионное моделирование не является частью предположения о предельных распределениях предикторов.
На практике, если вы сделаете предикторы более нормальными, то вы будете часто применять преобразования, которые делают функциональную форму более близкой к данным, что я бы назвал главной причиной трансформации, несмотря на огромный акцент на структура ошибок во многих текстах. Другими словами, ведение журнала предикторов, чтобы приблизить их к нормальному состоянию, может делать правильные вещи по неправильной причине, если вы приближаетесь к линейности в преобразованном пространстве.Иксβ
На этом форуме так много необычайно хороших советов по трансформации, что я сосредоточился на обсуждении того, что вы цитируете.
PS Вы добавляете оператор, начинающийся с «Например, при сравнении средств сравнение журналов с необработанными данными, очевидно, даст значительную разницу». Я не понимаю, что вы имеете в виду, но сравнение значений для одной группы с логарифмами значений для другой группы было бы просто бессмысленным. Я не понимаю остальную часть вашего заявления.