Вы можете использовать доверительный интервал (CI) для проверки гипотез. В типичном случае, если КИ для эффекта не охватывает 0, вы можете отклонить нулевую гипотезу. Но CI может использоваться для большего, в то время как сообщение о том, был ли он пройден, является пределом полезности теста.
Например, причина, по которой вам рекомендуется использовать CI вместо t-теста, заключается в том, что тогда вы можете делать больше, чем просто проверять гипотезы. Вы можете сделать заявление о диапазоне эффектов, которые, по вашему мнению, вероятны (те, что в КИ). Вы не можете сделать это только с помощью t-теста. Вы также можете использовать его, чтобы делать заявления о нулевом значении, чего нельзя сделать с помощью t-критерия. Если t-критерий не отклоняет нуль, тогда вы просто говорите, что не можете отклонить ноль, а это мало что говорит. Но если у вас узкий доверительный интервал вокруг нуля, то вы можете предположить, что ноль или близкое к нему значение, скорее всего, является истинным значением, и предположить, что эффект от обработки или независимая переменная слишком мал, чтобы быть значимым ( или что ваш эксперимент не
Добавлено позже:
я действительно должен был сказать, что, хотя вы можете использовать CI как тест, это не так. Это оценка диапазона, в котором, по вашему мнению, находятся значения параметров. Вы можете сделать тест как умозаключения, но вам гораздо лучше никогда не говорить об этом таким образом.
Как лучше?
А) Эффект составляет 0,6, т (29) = 2,8, р <0,05. Этот статистически значимый эффект ... (следует некоторое обсуждение этой статистической значимости без какого-либо упоминания или даже сильной способности обсуждать практическое значение величины открытия ... в рамках Неймана-Пирсона величина t и Значения p в значительной степени бессмысленны, и все, что вы можете обсудить, - это наличие эффекта или его отсутствие. Вы никогда не сможете говорить о том, что эффект фактически не основан на тесте.)
или
Б) Используя 95% доверительный интервал, я оцениваю эффект между 0,2 и 1,0. (В некоторых дискуссиях говорится о действительном влиянии интереса, о том, являются ли его вероятные значения какими-либо конкретными значениями, и какое-либо использование слова имеет значение именно для того, что оно должно означать. Кроме того, ширина КИ может идти непосредственно к обсуждение того, является ли это сильным открытием или можно сделать только более предварительный вывод)
Если вы взяли базовый класс статистики, вы могли бы изначально стремиться к A. А в некоторых случаях это лучший способ сообщить о результате. Но для большинства работ B намного выше. Оценка дальности не является проверкой.