Стандартная статистическая модель, лежащая в основе анализа таблиц сопряженности, заключается в допущении, что (безоговорочно по общему количеству) число ячеек является независимой пуассоновской случайной величиной. Так что если у вас естьн × мтаблица непредвиденных обстоятельств n × m , статистическая модель, используемая в качестве основы для анализа, учитывает, что у каждого количества ячеек есть безусловное распределение:
Икся , дж ~ Pois ( μя , дж)
После того, как вы наложите общее количество ячеек для таблицы сопряженности или число строк или столбцов, результирующие условные распределения количества ячеек станут многочленными. В любом случае для распределения Пуассона E ( Xя , дж) = V ( Xя , дж) = μя , дж , поэтому стандартизированное число ячеек равно:
STD ( Xя , дж) ≡ Xя , дж- E ( Xя , дж)V ( Xя , дж)------√= Xя , дж- μя, джμя , дж---√
Итак, в формуле, о которой вы спрашиваете, вы видите стандартизированное число ячеек в предположении, что число ячеек имеет (безусловное) распределение Пуассона.
Отсюда обычно тестируют независимость переменной строки и столбца в данных, и в этом случае вы можете использовать тестовую статистику, которая просматривает сумму квадратов вышеуказанных значений (что эквивалентно квадрату-норме вектора стандартизированных значений). Тест хи-квадрат предоставляет значение p для этого вида теста на основе приближения большой выборки к нулевому распределению статистики теста. Обычно применяется в случаях, когда ни один из показателей продаж не является слишком маленьким.
stdres
для стандартизированных остатков.