Надежность имеет различные значения в статистике, но все они подразумевают некоторую устойчивость к изменениям в типе используемых данных. Это может показаться немного двусмысленным, но это потому, что устойчивость может относиться к различным видам нечувствительности к изменениям. Например:
- Устойчивость к выбросам
- Устойчивость к ненормальности
- Устойчивость к непостоянной дисперсии (или гетероскедастичности)
В случае испытаний устойчивость обычно относится к тесту, который все еще остается действительным с учетом такого изменения. Другими словами, является ли результат значительным или нет, имеет смысл только при выполнении предположений теста. Когда такие предположения ослаблены (то есть не так важны), тест считается надежным.
Сила теста заключается в его способности обнаружить значительную разницу, если есть истинная разница. Причина, по которой конкретные тесты и модели используются с различными допущениями, заключается в том, что эти допущения упрощают проблему (например, для оценки требуется меньше параметров). Чем больше допущений делает тест, тем менее он надежен, потому что все эти допущения должны быть выполнены, чтобы тест был действительным.
С другой стороны, тест с меньшим количеством допущений является более надежным. Однако надежность обычно достигается за счет мощности, потому что либо используется меньшее количество информации из входных данных, либо необходимо оценить больше параметров.
T
T
FF