Предположим, у меня есть 20 мышей. Я так или иначе соединяю мышей, чтобы получить 10 пар. Для целей этого вопроса это может быть случайное спаривание, ИЛИ это может быть разумное спаривание, например, попытка спарить мышей одного и того же помета, одного пола, с одинаковым весом, ИЛИ это может быть намеренно глупое спаривание, подобное пытаясь спарить мышей с весами, которые могут быть неравны. Затем я использую случайные числа, чтобы назначить одну мышь в каждой паре контрольной группе, а другую мышь - группе, подлежащей лечению. Сейчас я провожу эксперимент, рассматривая только мышей, которых нужно лечить, но в остальном не обращая внимания на только что сделанные приготовления.
Когда нужно проанализировать результаты, можно использовать либо непарное, либо парное t-тестирование. Каким образом, если таковые имеются, будут отличаться ответы? (В основном меня интересуют систематические различия любого статистического параметра, который необходимо оценить.)
Причина, по которой я спрашиваю это, состоит в том, что статья, с которой я недавно был связан, была подвергнута критике биологом за использование парного t-теста, а не непарного t-теста. Конечно, в реальном эксперименте ситуация была не такой экстремальной, как ситуация, которую я набросал, и, на мой взгляд, были веские причины для спаривания. Но биолог не согласился.
Мне кажется, что невозможно неправильно улучшить статистическую значимость (уменьшить значение p) в описанных мною обстоятельствах, используя парный t-тест, а не непарный тест, даже если это неуместно для пары. Однако это может ухудшить статистическую значимость, если мыши были плохо спарены. Это правильно?