Если у меня много положительных, незначительных результатов, могу ли я проверить «хотя бы

9

Допустим, я провел одну и ту же регрессию для 100 разных людей по отдельности. Мои коэффициенты интереса положительны (и весьма отличаются друг от друга), но статистически незначимы во всех 100 результатах (скажем, каждое значение p = 0,11).

Есть ли способ объединить эти p-значения, чтобы сделать вывод, что «по меньшей мере 80 из этих результатов являются положительными» с большей значимостью, чем p = 0,11? Мои онлайн-поиски только показали мне, как сказать «по крайней мере 1 из этих результатов является положительным» с помощью теста Фишера или аналогичного теста, но я не смог обобщить этот результат. Я хочу проверить «H0 = все 100 эффектов одинаковы при 0» против «HA = как минимум 80 эффектов положительные».

Моя цель не состоит в том, чтобы сказать, что в среднем существует положительный коэффициент, и при этом он не предназначен для конкретного измерения коэффициента. Моя цель состоит в том, чтобы показать, что по меньшей мере 80 человек по отдельности сталкивались с каким-то положительным эффектом независимо от того, какие 80 человек, и независимо от величины эффекта, ощущаемого каждым человеком.

hypothesis-testing multiple-comparisons

— user28239
источник

2

Что вы имеете в виду, говоря "проводя одну и ту же регрессию для 100 человек отдельно"? - означает ли это, что у вас есть 100 наборов данных, каждый с несколькими наблюдениями на одном и том же наборе переменных ответа и объясняющих переменных? Не уверен, как это работает, например, если вы заинтересованы в сравнении роста и веса людей, у вас есть только одно наблюдение для каждого человека, так как вы подходите регрессии? Возможно, у вас есть временные ряды для каждого человека - в этом случае вам все равно нужны более сложные техники. Это было бы формой продольного анализа, если вы ищете условия поиска.

— Питер Эллис

8

Вы должны выполнить все 100 анализов в виде единой модели смешанных эффектов с самими случайными величинами ваших коэффициентов интереса. Таким образом, вы можете оценить распределение для этих коэффициентов, включая их среднее значение, что даст вам вид интерпретации, который, я думаю, вы ищете.

Отмечая, что, если, как я подозреваю, это так, у вас есть временные ряды для каждого человека, вам также необходимо будет исправить автокорреляцию остатков.

— Питер Эллис
источник

Спасибо за ваше время, высоко ценится. Если можно уточнить, это временные ряды. Допустим, у меня есть данные для всех 100 человек за 5 лет, а на третий год фиктивная переменная (интересующая меня независимая переменная) изменяется на 1 одновременно для всех 100 человек. Меня не волнует точное влияние этого изменения на каждого человека или средний эффект. Скорее, я только хочу установить, что как минимум 80 человек пострадали. Коэффициент положительный на все 100, но каждый незначительный. Я не уверен, что измерение распределения коэффициента позволит это сделать.

— user28239

1

Это то, что я догадался, что ты имел. Я думаю, что мой рекомендуемый подход правильный. Затем вы можете использовать модель, чтобы делать прогнозы или любую другую интерпретирующую вещь, которую вы хотите.

— Питер Эллис

4

Самое простое, что можно сделать, это, вероятно, тест на знак. Нулевая гипотеза состоит в том, что каждый результат имеет равную вероятность быть положительным или отрицательным (например, подбрасывание справедливой монеты). Ваша цель состоит в том, чтобы определить, будут ли наблюдаемые результаты достаточно маловероятными в соответствии с этой нулевой гипотезой, чтобы вы могли отклонить ее.

Какова вероятность получения 80 или более голов из 100 бросков честной монеты? Вы можете рассчитать это, используя биномиальное распределение. В R, вызывается соответствующая функция pbinom, и вы можете получить (одностороннее) p-значение, используя следующую строку кода:

pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)

Согласно этому тесту, ваша интуиция верна, вы вряд ли получите 80 положительных результатов случайно, если лечение не даст эффекта.

Тесно связанным вариантом было бы использовать что-то вроде теста рангов Уилкоксона .

Лучше подход, если вы на самом деле хотите , чтобы оценить величину эффекта (а не просто определить , как правило , является ли это быть больше нуля или нет), вероятно , будет иерархическая ( «смешанный») модель.

Здесь модель говорит, что результаты ваших 100 человек получены из распределения, и ваша цель - увидеть, где находится среднее значение этого распределения (вместе с доверительными интервалами).

Смешанные модели позволяют вам сказать немного больше о ваших величинах эффекта: после подбора модели вы можете сказать что-то вроде: «мы оцениваем, что наше лечение имеет тенденцию улучшать результаты в среднем на три единицы, хотя данные согласуются с истинным средним величина эффекта составляет от 1,5 до 4,5 единиц. Кроме того, между индивидуумами есть некоторые различия, поэтому данный человек может видеть эффект в диапазоне от -0,5 до +6,5 единиц ".

Это очень точный и полезный набор утверждений - гораздо лучше, чем просто «эффект, вероятно, в среднем положительный», поэтому статистики предпочитают этот подход. Но если вам не нужны все эти детали, первый подход, который я упомянул, тоже подойдет.

— Дэвид Дж. Харрис
источник

0

Может быть, я полностью ошибаюсь, но мне кажется, что вы пытаетесь сделать повторные измерения ANOVA. Просто определите этот «манекен» как фактор внутри субъекта, и модель сделает все остальное. Само значение не очень информативно; это необходимо, но не достаточно; любая модель получала бы значимость при достаточно большом количестве наблюдений. Вы можете захотеть получить размер эффекта, например (частично) Eta-Squared, чтобы понять, насколько «велик» ваш эффект. Мои 2 цента.

— Герберт
источник

0

Это может быть так же просто, как обычный расчет ANCOVA, но подходящий способ анализа ваших данных будет зависеть от физической ситуации, и вы не предоставили эти данные.

— Эмиль Фридман
источник