Например, люди часто предпочитают использовать непараметрический тест, когда какой-то другой тест предполагает, что остатки обычно не распределяются. Этот подход кажется довольно широко принятым, но, похоже, не согласуется с первым предложением в этом параграфе. Я просто надеялся получить разъяснения по этому вопросу.
Да, многие люди делают такие вещи и меняют свой второй тест на тот, который может иметь дело с гетероскедастичностью, когда они отвергают равенство дисперсии, и так далее.
То, что что-то общее, не обязательно означает, что это мудро.
Действительно, в некоторых местах (я не буду называть наиболее обидные дисциплины) многие из этих формальных проверок гипотез, зависящих от других формальных проверок гипотез, фактически преподаются.
Проблема с этим заключается в том, что ваши процедуры не имеют своих номинальных свойств, иногда даже не близких. (С другой стороны, допущение подобных вещей без какого-либо рассмотрения на предмет потенциально крайнего нарушения может быть даже хуже.)
Несколько статей предполагают, что для случая гетероскедастичности вам лучше просто действовать так, как будто дисперсии не равны, чем проверять это и делать что-то только с отклонением.
В нормальном случае это менее понятно. По крайней мере, в больших выборках во многих случаях нормальность не так уж важна (но по иронии судьбы, с большими выборками ваш тест нормальности будет с большей вероятностью отклонен), пока ненормальность не слишком дикая. Единственное исключение - интервалы прогнозирования, когда вам действительно нужно, чтобы ваше распределение было близко к правильному.
Частично, одна проблема состоит в том, что тесты гипотез отвечают на вопрос, отличный от того, на который нужно ответить. Вам на самом деле не нужно знать, «действительно ли данные нормальны» (почти всегда они априори не будут абсолютно нормальными ). Вопрос скорее в том, насколько сильно степень ненормальности повлияет на мой вывод.
Вторая проблема обычно либо практически не зависит от размера выборки, либо фактически улучшается при увеличении размера выборки, однако тесты гипотез почти всегда отклоняются при больших объемах выборки.
Есть много ситуаций, когда существуют надежные или даже свободные от распространения процедуры, которые очень близки к полной эффективности даже при обычной (и потенциально гораздо более эффективной при некоторых довольно скромных отклонениях от нее) - во многих случаях кажется глупым не принимать такой же осторожный подход.