Как бороться с потолочным эффектом благодаря измерительному инструменту?


12

Я собрал психофизиологические данные, измеряющие способность испытуемых (двух групп) воспринимать вибрацию. Вибрирующий зонд перемещается к коже при меньшем и меньшем смещении, и субъект указывает, когда он чувствует вибрацию. К сожалению, на высоких частотах датчик может перемещаться только на небольшое расстояние, и иногда наибольшее расстояние, которое может перемещать датчик, все еще недостаточно велико для восприятия испытуемыми. Таким образом, у меня есть точные пороговые значения для некоторых предметов, но для тех, кто никогда не чувствовал вибрации, у меня просто есть значение, которое я знаю, что их порог больше, чем. Могу ли я по-прежнему включать эти данные? И как лучше всего это проанализировать?


5
Это так называемые цензурные наблюдения . Как это сделать, зависит от того, какой статистический анализ вы проводите.

Я согласен с Прокрастинатором за исключением того, что я бы использовал термин усеченный. Подход к проблеме симлара, называемой правильной цензурой, встречается в анализе выживания, когда вы сохраняете усеченное значение, но у вас есть переменная индикатора, чтобы сказать вам, является ли значение полным или цензурированным. В анализе выживания есть простой способ справиться с этим, но это потому, что вы оцениваете кривую выживания. Здесь вы можете рассчитывать средние значения. Если вы игнорируете перемирие, вы недооцениваете среднее. Если вы выбрасываете усеченные точки, вы недооцениваете среднее значение.
Майкл Р. Черник

Чтобы правильно включить усеченные значения, вам понадобится вероятностная модель для пробного расстояния, учитывая, что оно превышает пороговое значение. Затем можно взять среднее значение этого распределения и вычислить средневзвешенное значение, используя среднее значение для значений, которые не были усреднены со средним для усеченного распределения, где взвешивание соответствует доле усеченных случаев.
Майкл Р. Черник

4
Усечение - это то, что произойдет, если вы выбросите не количественные данные. Вы не хотите этого делать! Вы правы, Кейл, что в этих цензурированных значениях есть информация, и вы подозреваете, что есть некоторые стандартные способы их анализа (и ловушки для неосторожных). Но чтобы дать хороший ответ, нам нужно знать, какой анализ вы ищете. В частности, обработка этих данных принципиально отличается в зависимости от того, являются ли они зависимыми или независимыми переменными в регрессии. Возможно, вы могли бы уточнить это?
whuber

1
Небольшая деталь, не имеющая отношения к рассматриваемому статистическому вопросу, но может быть полезно знать: данные такого рода обычно называют «психофизическими» данными, а не «психофизиологическими» (которые включают такие вещи, как показатели сердечного ритма или проводимости кожи, но не субъективные суждения о ощущениях ). Это также может помочь вам найти литературу о том, как люди обычно относятся к данным такого типа.
Гала-концерт

Ответы:


2

Мне нравится использовать гетерогенные модели смесей для описания комбинированных эффектов из принципиально разных источников.

Вы можете посмотреть на что-то вроде модели «Zero Inflated Poisson» в стиле Дайан Ламберт. " Нулевая инфляция Пуассона, с применением к дефектам в производстве ", Дайан Ламберт, Technometrics, Vol. 34, вып. 1, 1992

Я нахожу эту идею особенно восхитительной, поскольку она противоречит представлению о том, что применение статистического плана экспериментов в медицине не может полностью излечить болезнь. За идеей стоит идея о том, что научный метод не может завершить свое назначение в медицине, исходит из того, что нет данных о заболевании от «совершенно» здорового человека, и поэтому данные не могут дать информацию о лечении заболевания. Без измерения нет места для улучшения.

Использование чего-то вроде модели с нулевым раздуванием позволяет извлекать полезную информацию из данных, которые частично «безошибочны». Он использует понимание процесса, чтобы взять информацию, которую можно считать «безмолвной», и заставить ее говорить. Для меня это то, что вы пытаетесь сделать.

Сейчас я не могу начать утверждать, какие комбинации моделей использовать. Я подозреваю, что вы могли бы использовать модель Гауссовой смеси (GMM) с нулевой раздувкой для начинающих. GMM - это своего рода универсальный эмпирический аппроксиматор для непрерывных PDF-файлов, например, двоюродный брат PDF в приближении ряда Фурье, но с поддержкой центральной предельной теоремы для улучшения глобальной применимости и, как правило, для гораздо меньшего числа компонентов, чтобы сделать " хорошее "приближение.

Удачи.

РЕДАКТИРОВАТЬ:

Подробнее о моделях с нулевым давлением:


0

Кластеризация результатов и определение масштаба может быть решением.

Создайте переменную категории так (или иначе):

  1. Высокая чувствительность
  2. Нормальная чувствительность
  3. Низкая чувствительность
  4. Нечувствительный (те, которые зашкаливают в вашем случае)

Вы можете использовать эту переменную для анализа, но значимость результатов зависит от того, насколько хорошо вы определите категории.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.