Предположим, у нас есть случайная переменная, которая принимает нечисловые значения a, b, c и хочет количественно определить, как эмпирическое распределение выборок этой переменной отличается от истинного распределения. В этом случае применяется следующее неравенство (от Cover & Thomas ).
Теорема 12.4.1 (теорема Санова): Пусть - iid . Пусть - множество вероятностных распределений. Тогда где P ^ * = \ arg \ min_ {P \ in E} D (P || Q), является распределением в E , наиболее близким к Q по относительной энтропии.
Это неравенство довольно слабое для малых . Для бинарных результатов и граница Черноффа-Хеффдинга гораздо более жесткая.
Существует ли аналогичная строгая оценка для ?