Как рассчитать доверительные интервалы по коэффициентам регрессии в PLS?


10

Базовая модель PLS состоит в том, что заданная матрица и вектор связаны соотношением где - скрытая матрица , и - шумовые условия (сссуммируя центрированы).X n y X = T P + E , y = T q + f , T n × k E , f X , yn×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLS производит оценки и «сокращенного» вектора коэффициентов регрессии, такого, что . Я хотел бы найти распределение при некоторых упрощающих предположениях, которые, вероятно, должны включать следующее:& beta ; у ~ Х & beta ; & beta ;T,P,qβ^yXβ^β^

  1. Модель верна, т.е. для неизвестных ;T , P , qX=TP+E,y=Tq+fT,P,q
  2. Число скрытых факторов известно и используется в алгоритме PLS;k
  3. Фактические условия ошибки - это нормальное значение с нулевым средним с известными отклонениями;

Этот вопрос несколько недоопределен, потому что существует множество вариантов алгоритма PLS, но я бы согласился с результатами для любого из них. Я хотел бы также принять рекомендации о том , как оценить распределение с помощью , например , программа начальной загрузки, но , возможно, это отдельный вопрос.β^

Ответы:


9

Знаете ли вы эту статью: PLS-регрессия: основной инструмент хемометрики ? Получение SE и CI для параметров PLS описано в §3.11.

Я обычно полагаюсь на Bootstrap для вычисления КИ, как предложено, например, в Abdi, H. Частичная регрессия наименьших квадратов и проекция на скрытую регрессию структуры (PLS Regression) . Кажется, я помню, что теоретические решения обсуждались в Tenenhaus M. (1998) La régression PLS: Théorie et pratique (Technip), но я пока не могу проверить, так как у меня нет книги. На данный момент есть несколько полезных R-пакетов, таких как plsRglm .

PS Я только что обнаружил статью Николь Крамер , касающуюся пакета plsdof R.


2

Я обнаружил статью Reiss, et. и др. , Расчет доверительного интервала частичных наименьших квадратов для промышленного прогнозирования качества в конце партии , в котором появляется цитата:

Прогноз PLS должен сопровождаться доверительным интервалом онлайн, чтобы указывать точность прогноза. Формулировка доверительного интервала для прогноза PLS является областью исследования, в которой еще не заключен «золотой стандарт».

Эта статья содержит ссылку на «превосходный обзор такой работы», « Стандартная ошибка прогнозирования для многопутевого PLS » Фабера и Бро, и документ Фабера и Ковальски « Распространение ошибок измерения для проверки правильности прогнозов, полученных с помощью регрессии главных компонентов». и частичные наименьшие квадраты . Я подведу итоги этих результатов по мере их появления ...


(+1) Полезно знать, спасибо. Я должен снова взглянуть на работу Мишеля Тененхауса - я дам вам знать, если я нахожу это интересным.
ЧЛ
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.