Случайное назначение: зачем?


9

Случайное назначение является ценным, поскольку оно обеспечивает независимость лечения от возможных результатов. Вот как это приводит к объективным оценкам среднего эффекта лечения. Но другие схемы назначения также могут систематически обеспечивать независимость лечения от возможных результатов. Так зачем нам случайное назначение? Другими словами, в чем преимущество случайного назначения по сравнению со неслучайными схемами назначения, которые также приводят к непредвзятому выводу?

Пусть будет вектором назначений лечения, в котором каждый элемент равен 0 (единица не назначена для лечения) или 1 (единица назначена для обработки). В статье JASA Angrist, Imbens и Rubin (1996, 446-47) говорят, что назначение лечения является случайным, если для всех \ mathbf {c} и \ mathbf {c'}, таких что \ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '} , где \ iota - это вектор столбца со всеми элементами, равными 1.Z Pr ( Z = c ) = Pr ( Z = c ) c c ι T c = ι T c ZяPr(Zзнак равнос)знак равноPr(Zзнак равнос')сс'ιTсзнак равноιTс'ι

Другими словами, утверждение состоит в том, что назначение Zя является случайным, если любой вектор назначений, который включает в себя м назначений для лечения, столь же вероятен, как и любой другой вектор, который включает в себя м назначений для лечения.

Но, чтобы гарантировать независимость потенциальных результатов от назначения лечения, достаточно гарантировать, что каждая единица в исследовании имеет равную вероятность назначения лечения. И это может легко произойти, даже если большинство векторов назначения лечения имеют нулевую вероятность выбора. То есть это может произойти даже при неслучайном присваивании.

Вот пример. Мы хотим провести эксперимент с четырьмя единицами, в которых обрабатываются ровно два. Существует шесть возможных векторов назначения:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

где первая цифра в каждом номере указывает, была ли обработана первая единица, вторая цифра указывает, была ли обработана вторая единица, и так далее.

Предположим, что мы проводим эксперимент, в котором мы исключаем возможность присвоения векторов 3 и 4, но в котором каждый из других векторов имеет равный (25%) шанс выбора. Эта схема не является случайным назначением в смысле AIR. Но в ожидании это приводит к объективной оценке среднего эффекта лечения. И это не случайно. Любая схема назначения, которая дает субъектам равную вероятность назначения лечения, позволит объективно оценить ATE.

Итак: зачем нам случайное назначение в смысле AIR? Мой аргумент основан на рандомизированном заключении; если вместо этого думать с точки зрения основанного на модели вывода, кажется ли определение AIR более оправданным?


3
Я не читал Angrist и др., Так что, может быть, я что-то упустил, но у меня есть спор с вашей формулировкой. Мы не используем случайное назначение, чтобы гарантировать, что лечение не зависит от потенциальных результатов. Независимо от того, зависит ли лечение от результатов в реальном эксперименте, зависит от того, существует ли прямая причинно-следственная связь между лечением и результатом. Скорее, случайное назначение гарантирует, что лечение не зависит от скрывающихся переменных (или потенциальных нарушителей). Это вероятность того, что результат был вызван чем-то другим, кроме лечения, которое мы надеемся исключить.
gung - Восстановить Монику

1
@ Gung, я думаю, что вы объединяете "потенциальные результаты" и "результаты". Это правда, что случайное распределение не обеспечивает независимость лечения от результатов (то есть от наблюдаемых результатов). Но потенциальные результаты не совпадают с наблюдаемыми, и случайное распределение гарантирует независимость лечения от потенциальных результатов. Я не буду редактировать исходное сообщение, чтобы расширить этот вопрос; это отвело бы меня слишком далеко от основной темы. Но en.wikipedia.org/wiki/Rubin_causal_model может быть полезен в этом вопросе.
user697473

3
«Чтобы обеспечить независимость потенциальных результатов от назначения лечения, достаточно обеспечить, чтобы каждая единица в исследовании имела равную вероятность назначения лечения». Это неверно Предположим, вы включили в исследование мужчин и женщин. Переверните справедливую монету: если головы, назначьте всех женщин в группу лечения (и всех мужчин в контрольную группу); если хвосты, все мужчины будут в группе лечения и все женщины в контрольной группе. Каждый субъект (очевидно) имеет 50% вероятности назначения в группу лечения, но лечение полностью смешивается с полом. хИксИкс
whuber

1
@whuber, ваш комментарий не звучит правильно. Чтобы понять почему, предположим, что = 1. Потенциальные результаты для мужчины: Y (1) = 1 и Y (0) = 0. (То есть = 1, если мужчина лечится, 0, если нет.) Для женщины: потенциальные результаты Y (1) = -1 и Y (0) = 2. (Конкретные потенциальные результаты не имеют большого значения, но маленькие целые числа упрощают задачу.) Тогда E [Y (1) | Z] = E [Y (1)] = 0. Аналогичные равенства имеют место для E [Y (0)]. В целом, ваш механизм назначения не связан с полом, и он даст непредвзятую оценку ATE. Если я что-то неправильно понимаю, пожалуйста, дайте мне знать. Y мИксYм
user697473

3
Конечно, оценка «объективна» в том же смысле, что остановленные часы дают объективную оценку времени! На самом деле, это еще хуже: этот метод случайного отбора дает результаты, которые нельзя отнести к лечению, потому что их также можно отнести к полу. Вот что значит смущающее. Сосредоточение внимания на получении непредвзятых результатов при уничтожении всей полезной информации в эксперименте - это общеизвестное выбрасывание ребенка ...
whuber

Ответы:


8

Это следует за комментарием Гунга. Общий средний лечебный эффект не имеет значения.

Предположим, у вас есть новых случаев диабета, когда субъект находится в возрасте от 5 до 15 лет , и 1000 новых пациентов с диабетом старше 30 лет . Вы хотите назначить половину лечения. Почему бы не перевернуть монету, и на головах не лечить всех молодых пациентов, а на хвостах не лечить всех пожилых пациентов? Каждый будет иметь 50 %100051510003050%шанс быть выбранным для лечения, так что это не повлияет на средний результат лечения, но отбросит много информации. Не было бы неожиданностью, если бы ювенильный диабет или более молодые пациенты реагировали намного лучше или хуже, чем пожилые пациенты с диабетом типа II или гестационным диабетом. Наблюдаемый эффект лечения может быть непредвзятым, но, например, он будет иметь гораздо большее стандартное отклонение, чем при случайном назначении, и, несмотря на большую выборку, вы не сможете сказать много. Если вы используете случайное распределение, то с высокой вероятностью около случаев в каждой возрастной группе получат лечение, поэтому вы сможете сравнить лечение без лечения в каждой возрастной группе. 500

Вы можете быть в состоянии сделать лучше, чем использовать случайное назначение. Если вы заметили фактор, который, по вашему мнению, может повлиять на реакцию на лечение, возможно, вы захотите убедиться, что субъекты с этим атрибутом разделены более равномерно, чем при случайном назначении. Случайное назначение позволяет вам достаточно хорошо справляться со всеми факторами одновременно, чтобы впоследствии вы могли проанализировать множество возможных моделей.


Спасибо, Дуглас. Этот ответ имеет смысл для меня. Кстати, я не имел в виду ничего более экстремального, чем ваш пример или пример @ whuber выше. Я думал не о случаях, когда мы исключаем из рассмотрения лишь несколько векторов лечения. (Рассмотрим случай, когда клиент говорит: «Вы можете лечить этого или того, но не обоих».) Но я думаю, что ваши общие положения верны даже для более легких случаев, которые я имею в виду.
user697473

Я думаю, что если вы исключите только несколько векторов, вы не сильно измените объем информации, которую вы можете извлечь. Количественная оценка этого может быть грязной - есть наивные границы, которые, вероятно, слишком пессимистичны.
Дуглас Заре

FTFс

1

В вашем примере вы также можете опустить 2 и 5 и не противоречить себе. На уровне предмета все еще есть равный шанс быть 1 или 0, когда шансы 1 или 6 равны 1: 1. Но теперь то, что вы сделали, удалив 3 и 4, становится более очевидным.


Спасибо, Джон. Да вы правы. Кажется, что мы можем исключить столько векторов назначения лечения, сколько нам нужно, в любой комбинации, при условии, что мы используем оставшиеся векторы таким образом, чтобы дать каждой единице равную вероятность назначения лечения.
user697473

Я не думаю, что вы понимаете, что я говорю. То, что я представил, является аргументом ad absurdum для вашего аргумента против этого.
Джон

Ваш пример экстремален, но я не вижу в этом ничего абсурдного. Это правильная демонстрация сути: неслучайные схемы назначения (например, с использованием только векторов 1 и 6) могут привести к объективной оценке среднего эффекта лечения. Отсюда следует, что нам не нужно случайное назначение для получения объективных оценок ATE. Конечно, могут быть причины, по которым плохо удалять векторы со 2 по 5. (См . Комментарий Дугласа Заре выше .) Я еще не обдумал эти причины.
user697473

Вам следует. Вот почему вы не можете устранить их.
Джон

1

Вот еще одна из скрывающихся или смешанных переменных: время (или инструментальный дрейф, эффекты хранения образцов и т. Д.).
Таким образом, существуют аргументы против рандомизации (как говорит Дуглас: вы можете добиться большего успеха, чем рандомизация). Например, вы можете заранее знать, что вы хотите, чтобы ваши дела были сбалансированы с течением времени. Так же, как вы можете заранее знать, что вы хотите сбалансировать пол и возраст.

Другими словами, если вы хотите вручную выбрать одну из 6 своих схем, я бы сказал, что 1100 (или 0011) - это определенно плохой выбор. Обратите внимание, что первые возможности, которые вы выбросили, - это те, которые наиболее сбалансированы во времени ... И худшие два остались после того, как Джон предложил отбросить также 2 и 5 (против которых вы не протестовали).
Другими словами, ваша интуиция о том, какие схемы «хороши», к сожалению, приводит к плохому экспериментальному дизайну (ИМХО, это довольно распространенное явление; возможно, упорядоченные вещи выглядят лучше - и наверняка легче отслеживать логические последовательности во время эксперимента).

Возможно, вы сможете добиться большего успеха с нерандомизированными схемами, но вы также сможете добиться гораздо большего. ИМХО, вы должны быть в состоянии дать физические / химические / биологические / медицинские / ... аргументы для конкретной неслучайной схемы, которую вы используете, если вы идете по неслучайной схеме.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.