В тесте на соответствие критерия используется следующая статистика : В тесте предоставление этого условия выполнены, как используются - распределение для вычисления р-значение, учитывая правда можно было бы наблюдать такое значение в репрезентативной выборке одного и того же размера.
Однако для того, чтобы статистика следовала за -распределением (с степенями свободы), должно быть верно, что: для независимого, стандартного нормального ( Википедия ). Условия для теста следующие (опять же из Википедии ):
- Выборочный представитель населения
- Большой размер выборки
- Ожидаемое количество клеток достаточно велико
- Независимость между каждой категорией
Из условий (1,2) ясно, что мы удовлетворяем условиям вывода выборки из совокупности. (3) кажется необходимым предположением, потому что дискретный счет , который находится в знаменателе, не приводит к почти непрерывному распределению для каждого и если оно недостаточно велико, существует ошибка, которую можно исправить с помощью Yates Поправка - это, кажется, из того факта, что дискретное распределение в основном является «непрерывным» непрерывным, поэтому сдвиг на для каждого исправляет это.
Необходимость (4), кажется, пригодится позже, но я не вижу, как.
Сначала я подумал, что необходимо, чтобы статистика соответствовала распределению. Это привело меня к сомнительному предположению, что, что было действительно неправильно. Фактически, из уменьшения размерности для двух сторон равенства сnдоn-1ясно,что это не может быть так.
Благодаря объяснениям Уобера стало очевидно, что не должен равняться каждому O i - E i потому чтоχ20=∑n-1i=1Z2i(обратите внимание на уменьшение количества суммируемых переменных) для стандартных нормальных случайных величинZi,которые являютсяфункциональнонезависимыми
Мой вопрос , следовательно , как следовать за распределением χ 2 ? Какие виды комбинаций каждого из ( O i - E i ) 2Термины E i приводят к квадрату стандартных нормалейZ 2 i ? Это требует использования CLT, по-видимому (и это имеет смысл), но как? Другими словами, что каждыйZiравен (или приблизительно равен)?