Когда использовать регрессию Деминга


9

В настоящее время я работаю над тем, как преобразовать два разных значения фосфора друг в друга.

Фон

Существует множество (экстракционных) методов измерения содержания фосфора в почве. В разных странах применяются разные методы, поэтому для сравнения коэффициента рождаемости в разных странах необходимо рассчитать значение P-критерия x на основе значения P-критерия y и наоборот. Поэтому ответ и ковариата являются взаимозаменяемыми.

Количество P в экстрагенте 1 = P_CAL в [мг / 100 г почвы]

Количество P в экстрагенте 2 = P_DL в [мг / 100 г почвы]

Чтобы установить такое «уравнение трансформации», содержание Р в 136 пробах почвы было проанализировано с использованием экстрактов CAL и DL. Также были измерены дополнительные параметры, такие как pH почвы, общий органический углерод, общий азот, глина и карбонат. Цель состоит в том, чтобы вывести простую модель регрессии. На втором этапе также несколько моделей.

Чтобы дать обзор данных, я покажу вам две диаграммы рассеяния с простой линией регрессии (OLS). a) Простая регрессия OLS для CL-P ~ DL-P, b) Простая регрессия OLS для DL-P ~ CAL-P

Вопросов:

Насколько я понимаю, регрессия Деминга подходит, если переменная respone (y) и объяснительная (x) имеют ошибки (измерения) и являются взаимозаменяемыми. Регрессия Деминга предполагает, что коэффициент дисперсии известен. Поскольку у меня нет сведений о точности измерений извлечения P, есть ли другой способ определить коэффициент дисперсии? Какая разница здесь подразумевается? Я полагаю, это не рассчитывается var(DL_P)/var(CAL_P)?

Q1: Как определить коэффициент дисперсии для деминг регрессии?

Частным случаем регрессии Деминга является ортогональная регрессия. Предполагается, что коэффициент дисперсии = 1.

Q2: Есть ли способ диагностировать, является ли предположение δ = 1 «примерно» правильным или если (ложное) предположение влечет за собой большие ошибки прогнозирования?

Если я предполагаю, что δ = 1, то ортогональная регрессия дает следующий (округленный) результат

library(MethComp) deming <- Deming(y=P_CAL, x=P_DL, vr=1)

Перехват: 0,75; Наклон: 0,71; сигма P_DL: 3,17; сигма P_CAL: 3,17

Построение линии регрессии Деминга на вышеприведенных графиках показывает, что регрессия Деминга очень близка к а) регрессии CAL-P = f (DL-P), но очень отличается от b) DL-P = f (CAL-P) уравнение. введите описание изображения здесь

Q3: правильно ли, что в ортогональной регрессии CAL-P = f (DL-P) и DL-P = f (CAL-P) выражаются одним и тем же уравнением? Если нет, как я могу получить правильные уравнения для обоих? Что мне здесь не хватает?

Из-за свойств обоих экстракционных растворов, значения DL-P, как правило, примерно на 25% выше, чем значения CAL-P, поэтому CAL-P = f (DL-P) должен иметь более высокий наклон, чем DL-P = f (CAL -П). Однако это не выражается в регрессии Деминга, когда имеется только один наклон. Что оставляет меня с моим последним вопросом.

В4: Является ли регрессия Деминга правильным подходом для моей цели?


1
Отношение двух стандартных отклонений принимается в регрессии Деминга, чтобы решить, куда уронить перпендикуляр к линии. Если отношение равно 1, отклонения предполагаются равными, а расстояние измеряется под углом 45 градусов. Вы не можете определить это соотношение из данных.
Майкл Р. Черник

Ответы:


2

Чтобы решить часть ваших проблем здесь: регрессия Деминга, по- видимому , плохо вписывается в панель B графика, но это потому, что график неверен. Быстрый способ оценить, правильно ли это было сделано, - посмотреть на значения X & Y вдоль линии регрессии Деминга. Для любого значения DL-P на панели A оно должно иметь соответствующее значение CAL-P, идентичное на обеих панелях (НЕ верно для OLS и принципиальной разницы между ними). Но на этих графиках, где DL-P = 20, CAL-P на панели A составляет ~ 15, а на панели B ~ 27.

Ошибка, по-видимому, заключается в том, что линия регрессии Деминга была проведена простым обменом членами CAL-P и DL-P в уравнении. Уравнение для панели A:

CAL-P = 0,75 + 0,71 * DL-P

Переупорядочение, это подразумевает, что уравнение для панели B должно быть:

DL-P = (CAL-P - 0,75) / 0,71

И не:

DL-P = 0,75 + 0,71 * CAL-P (это то, что было построено)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.