Предположим , у меня есть образец от совместного распределения и . Как проверить гипотезу о том , что и являются независимыми ?X Y X Y
Не делается никаких предположений относительно законов совместного или предельного распределения и (наименьшая из всех нормальных норм совместного использования, поскольку в этом случае независимость идентична корреляции, равной ).Y 0
Не делается никаких предположений о природе возможных отношений между и ; оно может быть нелинейным, поэтому переменные некоррелированы ( ), но сильно взаимозависимы ( ).Y r = 0 I = H
Я вижу два подхода:
Бин обе переменные и использовать точный тест Фишера или G-тест .
- Pro: использовать проверенные статистические тесты
- Против: зависит от биннинга
Оценить зависимость от и : (это для независимой и и , когда они полностью определяют друг друга).Y I ( X ; Y )XY1
- Pro: производит число с ясным теоретическим значением
- Con: зависит от приблизительного вычисления энтропии (т.е. повторного биннинга)
Имеют ли эти подходы смысл?
Какие еще методы используют люди?