Как вы «контролируете» фактор / переменную?


19

Насколько я понимаю, «Контроль» может иметь два значения в статистике.

  1. Контрольная группа: в эксперименте лечение контрольной группе не проводится. Пример: плацебо против наркотиков: вы даете наркотики одной группе, а не другой (контроль), что также называется «контролируемым экспериментом».

  2. Контроль за переменной: метод выделения эффекта конкретной независимой переменной. Некоторые из других имен, данных этим методам, - «учет», «удержание постоянной», «контроль», некоторая переменная. Например: в исследовании по просмотру футбола (нравится или не нравится) вы можете устранить влияние пола, так как мы считаем, что пол вызывает предвзятость, то есть мужчине может нравиться больше, чем женщине.

Итак, мой вопрос к пункту (2). Два вопроса:

Как вы «контролируете» / «учитываете» переменные, в общем. Какие методы используются? (С точки зрения регрессии, рамки ANOVA).

В приведенном выше примере, выбор мужчины и женщины случайным образом представляет собой контроль? То есть является ли "случайность" одним из методов контроля других эффектов?


3
С точки зрения регрессии и ANOVA, контроль переменной обычно означает, что переменная была включена в модель.
Глен

Как говорит Глен, включение этого в модель - путь. Однако рандомизация используется для предотвращения смещения от эффектов, не включенных в модель. Как только дизайн создается, люди часто уравновешивают, чтобы удостовериться, что примерно одинаковое количество каждого пола в каждом лечении. Проблема с положением исключительно на рандомизацию и противовес заключается в том, что они преобразуют это смещение в дисперсию, и, следовательно, сложнее наблюдать, какой из ваших факторов активен.
neverKnowsBest

Ответы:


16

Как уже говорилось, контроль обычно означает включение переменной в регрессию (как отмечает @EMS, это не гарантирует успеха в достижении этого, он ссылается на это ). На эту тему уже существует несколько вопросов и ответов с высоким рейтингом, таких как:

Принятые ответы на эти вопросы - все это очень хорошая трактовка вопроса, который вы задаете в рамках наблюдательной (я бы сказал, корреляционной) структуры, больше таких вопросов можно найти здесь .

Тем не менее, вы задаете свой вопрос конкретно в рамках эксперимента или в рамках ANOVA, можно еще немного подумать на эту тему.

В рамках эксперимента вы контролируете переменную путем рандомизации отдельных лиц (или других единиц наблюдения) в различных условиях эксперимента. Основное предположение состоит в том, что как следствие единственное различие между условиями - экспериментальное лечение. При правильной рандомизации (т. Е. Каждый человек имеет одинаковый шанс оказаться в каждом состоянии), это разумное предположение. Кроме того, только рандомизация позволяет вам сделать причинные выводы из вашего наблюдения, поскольку это единственный способ убедиться, что другие факторы не несут ответственности за ваши результаты.

Однако может также потребоваться контролировать переменные в рамках эксперимента, а именно, когда существует другой известный фактор, который также влияет на эту зависимую переменную. Для повышения статистической мощности и может быть хорошей идеей для контроля за этой переменной. Обычной статистической процедурой, используемой для этого, является анализ ковариации (ANCOVA), который в основном также просто добавляет переменную в модель.

Теперь самое главное: чтобы ANCOVA была разумной, абсолютно необходимо, чтобы присвоение группам было случайным и чтобы ковариат, для которого он контролируется, не коррелировал с переменной группировки.
К сожалению, это часто игнорируется, что приводит к непонятным результатам. Миллер и Чепмен (2001) дают действительно читаемое введение в эту точную проблему (то есть, когда использовать ANCOVA или нет ) :

Несмотря на многочисленные технические обработки во многих местах, анализ ковариации (ANCOVA) остается широко используемым подходом к решению существенных групповых различий по потенциальным ковариатам, особенно в исследованиях психопатологии. Опубликованные статьи приводят к необоснованным выводам, а некоторые статистические тексты пренебрегают этой проблемой. Проблема с ANCOVA в таких случаях рассматривается. Во многих случаях нет средств для достижения поверхностно привлекательной цели «исправления» или «контроля» реальных групповых различий в потенциальной ковариате. В надежде сократить злоупотребление ANCOVA и содействовать надлежащему использованию, предлагается нетехническое обсуждение, подчеркивающее существенную путаницу, редко упоминаемую в учебниках и других общих презентациях, в дополнение к уже имеющейся математической критике.


Миллер Г.А. & Чепмен Д.П. (2001). Непонимание анализа ковариации. Журнал аномальной психологии , 110 (1), 40–48. DOI: 10,1037 / 0021-843X.110.1.40


Просто чтобы подчеркнуть точку в этом вопросе (который часто задают повторно), полезно учитывать, что простое включение переменной в модель не гарантирует «контроль» за ее эффектом, даже при очень сильных предположениях о существовании переменной. монотонно связано с зависимой переменной. Смотрите статью, на которую есть ссылки в моем другом комментарии.
Ely

1
@ EMS Хороший вопрос. Я добавил предупреждение и вашу ссылку на начало текста. Не стесняйтесь редактировать мой текст, если вы чувствуете, что есть что добавить.
Хенрик

0

Чтобы контролировать переменную, можно выровнять две группы по соответствующей характеристике, а затем сравнить разницу по исследуемой проблеме. Я могу объяснить это только примером, а не формально, B-школа - это годы в прошлом, так что есть.

Если бы вы сказали:

Бразилия богаче Швейцарии, потому что национальный доход Бразилии составляет 3524 млрд. Долларов, а Швейцария - всего 551 млрд.

Вы были бы правы в абсолютном выражении, но любой человек старше 12 лет, обладающий мимолетным знанием мира, подозревал бы, что с этим утверждением тоже что-то не так.

Было бы лучше довести население Швейцарии до уровня населения Бразилии, а затем снова сравнить доходы. Итак, если бы население Швейцарии было размером с Бразилию, их доход был бы:

(210 миллионов / 8,5 миллиона) * 551 миллиард долларов = 13612 миллиардов долларов

Это делает их примерно в 4 раза богаче Бразилии с 3524 миллиардами долларов.

И да, вы также можете использовать подход на душу населения, где вы сравниваете средние доходы. Но вышеупомянутый подход, вы можете применить это несколько раз.


1
Вы, кажется, описываете некоторую форму нормализации, а не «контроля» в том смысле, который подразумевается в вопросе.
whuber

На самом деле, я думаю, что это то же самое. Если вы так не думаете, не стесняйтесь
уточнять

Я не думаю, что мне нужно добавлять к другим ответам, уже появляющимся в этой теме.
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.