- Существует ли метод моделирования, такой как LOESS, который допускает ноль, один или несколько разрывов, где время разрывов не известно априори?
- Если метод существует, есть ли существующая реализация в R?
Ответы:
Звучит так, как будто вы хотите выполнить обнаружение нескольких точек изменения с последующим независимым сглаживанием внутри каждого сегмента. (Обнаружение может быть онлайн или нет, но ваше приложение вряд ли будет онлайн.) Об этом много литературы; Поиски в интернете плодотворны.
Я не искал никаких реализаций R (я кодировал одну из них в Mathematica некоторое время назад), но был бы признателен, если бы вы нашли такую.
сделать это с помощью регрессии ломаной линии Кенкера, см. стр. 18 этой виньетки
http://cran.r-project.org/web/packages/quantreg/vignettes/rq.pdf
В ответ на Уубер последний комментарий:
Эта оценка определяется следующим образом.
, x ( i ) ≥ x ( i - 1 ) ,
,
, z - = max ( - z , 0 ) ,
, λ ≥ 0
дает желаемый квантиль (т.е. в примере τ = 0,9 ). λ направляет количество точек останова: прибольших значениях λ эта оценка сокращается до точкиостанова(соответствует классической оценке линейной квантильной регрессии).
Квантильные сглаживающие сплайны Roger Koenker, Pin Ng, Stephen Portnoy Biometrika, Vol. 81, No. 4 (Dec., 1994), pp. 673-680
PS: есть открытый рабочий документ с таким же названием, но не одно и то же.
Вот некоторые методы и связанные пакеты R для решения этой проблемы
Оценка вейвлет- порога в регрессии учитывает разрывы. Вы можете использовать пакет wavethresh в R.
Многие древовидные методы (недалеко от идеи вейвлета) полезны, когда у вас есть разрывы. Отсюда пакет Treethresh, пакет дерева!
В семействе методов " местного максимального правдоподобия " ... среди прочего: Работа Пожеля и Спокойны: адаптивное сглаживание весов (пакет aws) Работа Екатерины Лоадер: пакет locfit
Я предполагаю, что любое ядро, более гладкое с локально изменяющейся пропускной способностью, имеет смысл, но я не знаю R пакета для этого.
примечание: я на самом деле не понимаю, в чём разница между LOESS и регрессией ... Является ли идея, что в алгоритмах LOESS должны быть "на линии"?
Должна быть возможность кодировать решение в R, используя нелинейную регрессионную функцию nls, b splines (например, функцию bs в пакете spline) и функцию ifelse.