Регрессия ошибок в переменных: допустимо ли объединение данных с трех сайтов?


15

Недавно ко мне пришел клиент, чтобы выполнить анализ начальной загрузки, потому что рецензент FDA сказал, что их регрессия ошибок в переменных была недействительной, потому что при объединении данных с сайтов анализ включал объединение данных с трех сайтов, где два сайта включали некоторые выборки, которые были то же самое.

ФОН

У клиента был новый метод анализа, который он хотел показать, «эквивалентный» существующему утвержденному методу. Их подход состоял в том, чтобы сравнить результаты обоих методов, примененных к одним и тем же образцам. Три сайта были использованы для тестирования. Ошибки в переменных (регрессия Деминга) применялись к данным на каждом сайте. Идея состоит в том, что если бы регрессия показала, что параметр наклона был близок к 1, а точка пересечения около 0, это показало бы, что два метода анализа дали почти одинаковые результаты, и, следовательно, новый метод должен быть одобрен. На участке 1 у них было 45 образцов, что дало им 45 парных наблюдений. На участке 2 было 40 образцов, на участке 3 - 43 образца. Они выполнили три отдельные регрессии Деминга (предполагая отношение 1 к ошибкам измерения для двух методов). Таким образом, алгоритм минимизировал сумму квадратов перпендикулярных расстояний.

В своем представлении клиент указал, что некоторые образцы, использованные на участках 1 и 2, были одинаковыми. В обзоре рецензент FDA сказал, что регрессия Деминга была недействительной, потому что были использованы общие выборки, что вызывает «интерференцию», которая делает недействительными допущения модели. Они просили применить корректировку начальной загрузки к результатам Деминга, чтобы учесть это вмешательство.

В тот момент, когда клиент не знал, как сделать начальную загрузку, меня привели. Термин «вмешательство» был странным, и я не был точно уверен, к чему стремится рецензент. Я предположил, что суть в том, что из-за того, что у объединенных данных были общие выборки, для общих выборок будет корреляция, и, следовательно, члены ошибки модели не все будут независимыми.

АНАЛИЗ КЛИЕНТА

Три отдельные регрессии были очень похожи. Каждый имел параметры наклона, близкие к 1, и перехватывал около 0. 95% доверительный интервал содержал 1 и 0 для наклона и перехвата соответственно в каждом случае. Основным отличием было несколько более высокое остаточное отклонение на участке 3. Кроме того, они сравнили это с результатами выполнения OLS и обнаружили, что они очень похожи (только в одном случае доверительный интервал для наклона на основе OLS не содержал 1). В случае, когда OLS CI для наклона не содержал 1, верхняя граница интервала была чем-то вроде 0,99.

Поскольку результаты были одинаковыми на всех трех сайтах, объединение данных сайта казалось разумным. Клиент сделал объединенную регрессию Деминга, которая также привела к подобным результатам. Учитывая эти результаты, я написал отчет для клиента, оспаривая утверждение, что регрессии были недействительными. Мой аргумент заключается в том, что, поскольку в обеих переменных имеются одинаковые ошибки измерения, клиент был прав, используя регрессию Деминга как способ показать согласие / несогласие. У регрессий отдельных сайтов не было проблем с коррелированными ошибками, поскольку ни одна из выборок не повторялась на данном сайте. Объединение данных для получения более точных доверительных интервалов.

Эта трудность может быть устранена путем простого объединения данных с общими образцами с сайта 1, скажем, без учета. Кроме того, три модели сайта не имеют проблемы и являются действительными. Мне кажется, это является убедительным доказательством согласия даже без объединения. Кроме того, измерения были проведены независимо на участках 1 и 2 для общих участков. Таким образом, я думаю, что даже объединенный анализ, использующий все данные, является действительным, потому что ошибки измерения для образца на участке 1 не коррелируют с ошибками измерения в соответствующем образце на участке 2. Это действительно равносильно повторению точки в проекте пространство, которое не должно быть проблемой. Это не создает корреляцию / «вмешательство».

В своем отчете я написал, что анализ начальной загрузки не был необходим, потому что нет никакой корреляции для корректировки. Три модели площадок были действительны (никаких возможных «помех» внутри площадок), и можно было провести объединенный анализ, удалив общие образцы на площадке 1 при проведении объединения. Такой объединенный анализ не может иметь проблемы с помехами. Настройка начальной загрузки не понадобится, потому что нет смещения для настройки.

ВЫВОД

Клиент согласился с моим анализом, но боялся принять его в FDA. Они все равно хотят, чтобы я выполнил настройку начальной загрузки.

МОИ ВОПРОСЫ

А) Согласны ли вы с (1) моим анализом результатов клиента и (2) моим аргументом о том, что загрузчик не нужен.

Б) Учитывая, что я должен начать регрессию Деминга, существуют ли какие-либо процедуры SAS или R, которые мне доступны для выполнения регрессии Деминга на выборках начальной загрузки?

РЕДАКТИРОВАТЬ: Учитывая предложение Билла Хубера, я планирую посмотреть на границы регрессии ошибок в переменных с помощью регрессии и у на х и х на у. Мы уже знаем, что для одной версии OLS ответ по существу совпадает с ошибками в переменных, когда предполагается, что две дисперсии ошибок равны. Если это верно для другой регрессии, то я думаю, что это покажет, что регрессия Деминга дает подходящее решение. Вы согласны?

Чтобы удовлетворить запрос клиента, мне нужно выполнить запрошенный начальный анализ, который был неопределенно определен. С этической точки зрения я думаю, что было бы неправильно просто предоставить начальную загрузку, потому что она на самом деле не решает реальную проблему клиента, которая заключается в обосновании процедуры измерения анализа. Поэтому я дам им оба анализа и, по крайней мере, прошу, чтобы они сообщили FDA, что в дополнение к начальной загрузке я выполнил обратную регрессию и ограничил регрессии Деминга, которые я считаю более подходящими. Также я думаю, что анализ покажет, что их метод эквивалентен эталонному, и поэтому регрессия Деминга также адекватна.

Я планирую использовать программу R, которую @whuber предложил в своем ответе, чтобы дать мне возможность начать регрессию Деминга. Я не очень знаком с R, но думаю, что смогу это сделать. У меня установлен R вместе с R Studio. Будет ли это сделать достаточно легко для новичка, как я?

Также у меня есть SAS и мне удобнее программировать на SAS. Так что, если кто-нибудь знает способ сделать это в SAS, я был бы рад узнать об этом.


2
Я не знаю ответа на этот вопрос, но разве не лучше было бы делать то, что хочет FDA, и показывать (по крайней мере, предположительно), что результаты схожи? (Хороший вопрос, кстати, +1)
Питер Флом - Восстановить Монику

1
Да @PeterFlom Я согласен с тем, что проведение анализа для FDA и его показ не имеет значения. Но я думаю, что дипломатическое указание на результаты регрессий и их последствия и объединение без перекрывающихся выборок усиливает аргумент. Я собираюсь сделать начальную загрузку, но я мог бы использовать помощь в поиске доступного программного обеспечения, чтобы выполнить регрессию Деминга самостоятельно, без ее самостоятельного кодирования.
Майкл Р. Черник

2
Майкл, возможность «образцов», общих для «сайтов», ставит под сомнение некоторые естественные интерпретации того, что могут означать эти (абстрактные) термины. Например, я изначально думал о «сайтах» как о разных географических местоположениях, а «образцы» как об отдельных объектах, связанных с этими местоположениями, каждый из которых подвергался независимым измерениям. В этой модели образцы не могут быть общими для разных сайтов. Не могли бы вы уточнить, что вы подразумеваете под этими терминами?
whuber

3
@whuber сайты находятся в разных местах. Образцы цитратной плазмы от индивидуумов. Лабораторное тестирование проводится на разных сайтах в разное время. Сравнения даны для двух измерительных приборов, предназначенных для выполнения одной и той же функции. На участках 1 и 2 некоторые образцы использовались повторно, но устройства работали независимо на участке 1 и участке 2. Поэтому я и говорю, что ошибки измерения действительно независимы, даже если используются одни и те же образцы (или части одинаковых образцов) ,
Майкл Р. Черник

1
а) Договорились, что исключение дублированного образца из объединенного анализа снимает опасения по поводу отсутствия независимости. б) Очень немногие пользователи SAS считают, что «легко» использовать R для анализа начальной загрузки с использованием необычных методов регрессии. Анализ начальной загрузки действительно требует способа мышления функционального программирования, и это не тот режим, который поощряет SAS.
DWin

Ответы:


10

Это проблема взаимной калибровки, то есть количественного сравнения двух независимых измерительных приборов.

Похоже, есть две принципиальные проблемы. Первый (который только подразумевается в вопросе) заключается в формулировании проблемы: как определить, является ли новый метод «эквивалентным» утвержденному? Второй касается того, как анализировать данные, в которых некоторые образцы могли быть измерены более одного раза.

Обрамление вопроса

Лучшее (и, возможно, очевидное) решение поставленной проблемы - это оценка нового метода с использованием образцов с точно известными значениями, полученными из сопоставимых сред (таких как плазма человека). (Обычно это делается путем добавления реальных образцов в стандартные материалы с известной концентрацией.) Поскольку это не было сделано, давайте предположим, что это либо невозможно, либо будет неприемлемо для регуляторов (по любой причине). Таким образом, мы сводимся к сравнению двух методов измерения, один из которых используется в качестве эталона, потому что он считается точным и воспроизводимым (но без идеальной точности).

По сути, клиент будет запрашивать, чтобы FDA разрешил новый метод в качестве прокси или суррогата для утвержденного метода. Таким образом, их обязанность состоит в том, чтобы продемонстрировать, что результаты нового метода с достаточной точностью предскажут, что определил бы утвержденный метод, если бы он был применен. Тонкий аспект этого заключается в том, что мы не пытаемся предсказать истинные ценности сами - мы даже не знаем их. Таким образом, регрессия ошибок в переменных может быть не самым подходящим способом для анализа этих данных.

YИксИксYYИксYИкс, (По моему опыту этот подход имеет тенденцию быть консервативно строгим: эти интервалы могут быть удивительно большими, если оба измерения не являются высокоточными, точными и линейно связанными.)

Обращение к дублирующим образцам

Соответствующие концепции здесь имеют пример поддержки и компонентов дисперсии. «Образец поддержки» относится к физической части предмета (человека здесь), который фактически измеряется. После взятия некоторой части объекта его обычно нужно разделить на подвыборки, подходящие для процесса измерения. Мы могли бы быть обеспокоены возможностью изменения между подвыборками. В жидком образце, который хорошо перемешан, по существу нет изменений в основном количестве (например, концентрации химического вещества) по всему образцу, но в образцах твердых веществ или полутвердых веществ (которые могут включать кровь) такое изменение может быть существенный. Принимая во внимание, что лабораториям часто требуются только микролитры раствора для выполнения измерения, мы должны быть обеспокоены изменением почти в микроскопическом масштабе. Это может быть важно.

Возможность такого изменения в пределахфизическая выборка показывает, что изменение результатов измерений должно быть разделено на отдельные «компоненты дисперсии». Одним из компонентов является отклонение от изменения внутри выборки, а другие являются вкладом в отклонение от каждого независимого этапа последующего процесса измерения. (Эти этапы могут включать физический акт подвыборки, дальнейшую химическую и физическую обработку образца - например, добавление стабилизаторов или центрифугирование), введение образца в измерительный прибор, изменения внутри инструмента, изменения между инструментами и другие. различия из-за изменений в том, кто управляет прибором, возможного загрязнения окружающей среды в лабораториях и т. д. Я надеюсь, это ясно дает понять, что для того, чтобы действительно хорошо ответить на этот вопрос, статистику необходимо глубокое понимание всего процесса отбора проб и анализа. Все, что я могу сделать, это дать общее руководство.)

Эти соображения применимы к рассматриваемому вопросу, потому что один «образец», который измеряется в двух разных «местах», на самом деле представляет собой два физических образца, полученных от одного человека и затем распределенных между лабораториями. Для измерения по утвержденному методу будет использоваться один фрагмент разделенного образца, а для одновременного измерения новым методом будет использоваться другой фрагмент разделенного образца. Рассматривая компоненты дисперсии, подразумеваемые этими расщеплениями, мы можем решить основную проблему вопроса. Теперь должно быть ясно, что различия между этими парными измерениями следует отнести к двум вещам: во-первых, реальные различия между процедурами измерения - это то, что мы пытаемся оценить, - и, во-вторых, различия из-за любых изменений в пределахобразец, а также отклонения, вызванные физическими процессами извлечения двух подвыборок, подлежащих измерению. Если физические рассуждения об однородности выборки и процессе подвыборки могут установить, что вторая форма дисперсии незначительна, то действительно, как утверждает рецензент, «интерференция» отсутствует. В противном случае эти компоненты дисперсии, возможно, потребуется явно смоделировать и оценить в анализе обратной регрессии.


1
Спасибо за очень хороший анализ, предлагающий лучший способ решения этой проблемы. Однако в моей конкретной ситуации клиент выбрал регрессионный подход Деминга и не ищет другого метода. Впечатление FDA от регрессии Деминга, по-видимому, происходит только из-за помех, и их предложение обойти проблему - это своего рода бутстрапная коррекция. Меня привезли только потому, что они не знают, как сделать начальную загрузку. Они не занимаются статистикой и не представили статистический анализ результатов, как я дал в своем отчете.
Майкл Р. Черник

2
Я ценю ограничения (и должен был быть прямо об этом). В целом, тем не менее, хорошая основа для решения подобных вопросов - выбрать подходящую модель в качестве отправной точки. Если вы попытаетесь обосновать свой путь к решению, используя ненадлежащий подход и неверную модель (чтобы удовлетворить клиента), вы только усугубите ошибки и не сможете найти какое-либо явно оправданное решение. Что вы могли бы рассмотреть сейчас, так это то, как регрессия Деминга отличается от обратной регрессии, а также как регрессия Деминга может быть адаптирована для учета множества компонентов дисперсии.
whuber

1
Вы можете быть мотивированы, чтобы продемонстрировать, что регрессия Деминга, как уже применено, достаточно близка к тому, что произведет более обычный или подходящий метод: такая демонстрация может быть наилучшим возможным решением в вашей ситуации.
whuber

Вместо этого они просто описали проблему и то, как были собраны данные, и отобразили результаты регрессии Деминга. Если бы привлекался статистик, возможно, было бы меньше статистических вопросов, связанных с регрессией Деминга. Все, что я могу сделать для клиники, - это предоставить анализ проведенного анализа (который включал объяснение того, почему большую часть регрессии можно анализировать, не беспокоясь о помехах от повторной выборки из общего источника), и обеспечить запрошенную загрузку. поправка на остаточную дисперсию в объединенной модели.
Майкл Р. Черник

На данный момент я не могу сказать им сделать обратную регрессию. Если метод измерения будет одобрен, я думаю, что его можно рассматривать как справочный материал, и бремя для компании состоит в том, чтобы показать, что новый метод по существу выполняет ту же работу, что и контрольный. Для этого я думаю, что регрессия Деминга может быть подходящей и, по крайней мере, приемлемой для FDA. Вероятно, было бы, если бы проблема повторных образцов не возникла. Эта проблема не возникла бы, если бы они оставили наш один из повторных образцов, когда они сделали объединение.
Майкл Р. Черник
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.