Что ж, если бы вы знали дисперсии в непарном и парном (которые, как правило, были бы значительно меньше), оптимальные веса для двух оценок различий в группах означали бы наличие весов, обратно пропорциональных дисперсии отдельного человека. оценки разницы в средствах.
[Правка: получается, что когда оцениваются отклонения, это называется оценкой Грейбилла-Дила. Там было довольно много статей об этом. Вот один]
Необходимость оценки дисперсии вызывает некоторую трудность (результирующее соотношение оценок дисперсии равно F, и я думаю, что полученные веса имеют бета-распределение, а результирующая статистика является довольно сложной), но, поскольку вы рассматриваете возможность начальной загрузки, это может быть меньше проблем.
Альтернативная возможность, которая может быть лучше в некотором смысле (или, по крайней мере, немного более устойчивой к ненормальности, так как мы играем с коэффициентами дисперсии) с очень малой потерей эффективности в норме, состоит в том, чтобы основывать комбинированную оценку отклонения парные и непарные ранговые тесты - в каждом случае своего рода оценка Ходжеса-Лемана, в непарном случае на основе медиан парных различий между выборками и в парном случае от медиан парных средних средних парных различий. Опять же, линейная комбинация двух взвешенных по минимальной дисперсии весов будет пропорциональна инверсиям дисперсий. В этом случае я бы, вероятно, склонялся к перестановке (/ randomization), а не к начальной загрузке - но в зависимости от того, как вы реализуете свою начальную загрузку, они могут оказаться в одном месте.
В любом случае вы можете захотеть повысить достоверность своих отклонений / уменьшить соотношение отклонений. Попадание в правильное положение по весу - это хорошо, но при нормальной работе вы потеряете очень мало эффективности, сделав его слегка устойчивым. ---
Некоторые дополнительные мысли, которые у меня не были достаточно четко разобраны в моей голове:
Эта проблема имеет явное сходство с проблемой Беренса-Фишера, но еще сложнее.
Если бы мы фиксировали веса, мы могли бы просто ударить в приближении типа Уэлча-Саттертвейта; структура проблемы одинакова.
Наша проблема заключается в том, что мы хотим оптимизировать весовые коэффициенты, что фактически означает, что весовые коэффициенты не являются фиксированными - и, действительно, имеет тенденцию максимизировать статистику (по крайней мере приблизительно и более близко в больших выборках, поскольку любой набор весовых коэффициентов является случайной величиной, оценивающей одинаковую величину). числитель, и мы пытаемся свести к минимуму знаменатель; два не являются независимыми).
Я ожидаю, что это ухудшит приближение хи-квадрат и почти наверняка еще больше повлияет на df приближения.
[Если эта проблема выполнима, может также оказаться хорошим эмпирическое правило, которое скажет: «Вы можете сделать почти так же хорошо, если вы используете только парные данные при этих наборах обстоятельств, только непарные при этих других наборах В остальных условиях эта схема с фиксированным весом обычно очень близка к оптимальной », но я не буду задерживать дыхание в ожидании этого шанса. Такое правило принятия решений, несомненно, будет иметь некоторое влияние на истинное значение в каждом случае, но если этот эффект не будет таким большим, такое практическое правило даст людям простой способ использовать существующее устаревшее программное обеспечение, поэтому может быть желательно попытаться определить такое правило для пользователей в такой ситуации.]
---
Изменить: Примечание для себя - нужно вернуться и заполнить детали работы над тестами «перекрывающихся образцов», особенно t-тестами перекрывающихся образцов
---
Мне приходит в голову, что тест рандомизации должен работать нормально -
где данные спарены, вы случайным образом переключаете метки группы в пары
если данные непарные, но предполагается, что они имеют общее распределение (под нулевым значением), вы переставляете групповые назначения
Теперь вы можете основывать веса на двух сдвиговых оценках на основе относительных дисперсионных оценок ( вес1= 1 / (1+ V1v2)), вычислите взвешенную оценку сдвига каждой рандомизированной выборки и посмотрите, где выборка вписывается в распределение рандомизации.
(Добавлено намного позже)
Возможно актуальная статья:
Деррик Б., Русс Б., Тохер Д. и Уайт П. (2017),
«Статистика испытаний для сравнения средств для двух выборок, включающих как парные, так и независимые наблюдения»,
журнал «Современные прикладные статистические методы» , май Вып. 16, № 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm