Направление ветра (здесь измеряется в градусах, предположительно как направление компаса по часовой стрелке от севера) является круговой переменной. Тест состоит в том, что обычное начало шкалы совпадает с концом, то есть . Когда рассматривается как предиктор, это, вероятно, лучше всего отображается на синус и косинус. Каким бы ни было ваше программное обеспечение, вероятно, что углы будут измеряться в радианах, поэтому преобразование будет некоторым эквивалентом0∘= 360∘
грех( π направление / 180 ) , cos( π направление / 180 )
учитывая, что радианы . Точно так же время суток, измеренное в часах с полуночи, можно сопоставить с синусом и косинусом, используя= 360 ∘2 π= 360∘
грех( π время / 12 ) , cos( π время / 12 )
или
грех( π( время + 0,5 ) / 12 ) , cos( π( время + 0,5 ) / 12 )
в зависимости от того, как именно время было записано или должно быть интерпретировано.
Иногда природа или общество являются обязательными, и зависимость от круговой переменной принимает форму некоторого направления, являющегося оптимальным для реакции, а противоположное направление (на половине круга) является пессимальным. В этом случае может быть достаточно одного синуса и косинуса; для более сложных шаблонов вам могут понадобиться другие термины. Для гораздо более подробно учебник по этой методике круговой, Фурье периодической, тригонометрической регрессии можно найти здесь , с , в свою очередь дальнейшие ссылки. Хорошей новостью является то, что после того, как вы создали синус и косинус, они станут дополнительными предикторами в вашей регрессии.
Существует много литературы по круговой статистике, которая сама по себе рассматривается как часть статистики направлений. Как ни странно, этот метод часто не упоминается, поскольку в этой литературе основное внимание уделяется переменным кругового отклика. Суммирование круговых переменных их векторными средствами является стандартным описательным методом, но не является обязательным или непосредственно полезным для регрессии.
Некоторые подробности о терминологии Направление ветра и время суток представлены в статистических терминах переменными, а не параметрами, независимо от использования в вашей отрасли науки.
Линейная регрессия определяются по линейности в параметрах, т.е. для вектора предсказанного это вектор параметры , а не матрица предикторов , что является более важным. Таким образом, в этом случае тот факт, что такие предикторы, как синус и косинус измеряются по круговым шкалам, а также ограничиваются , не препятствуют их появлению в линейной регрессии.X β β X [ - 1 , 1 ]YИксββX[−1,1]
Случайный комментарий Для переменной отклика, такой как концентрация частиц, я ожидал бы использовать обобщенную линейную модель с логарифмической связью, чтобы обеспечить положительные прогнозы.