Неравенство типа Чернова для случайной величины с 3 результатами


9

Предположим, у нас есть случайная переменная, которая принимает нечисловые значения a, b, c и хочет количественно определить, как эмпирическое распределение выборок этой переменной отличается от истинного распределения. В этом случае применяется следующее неравенство (от Cover & Thomas ).N

Теорема 12.4.1 (теорема Санова): Пусть - iid . Пусть - множество вероятностных распределений. Тогда где P ^ * = \ arg \ min_ {P \ in E} D (P || Q), является распределением в E , наиболее близким к Q по относительной энтропии.Икс1,Икс2,...,ИксN~Q(Икс)
Еп

QN(Е)знак равноQN(ЕпN)(N+1)|Икс|2-ND(п*||Q),
п*знак равноArgминпЕD(п||Q),
ЕQ

Это неравенство довольно слабое для малых N . Для бинарных результатов |Икс|знак равно2 и граница Черноффа-Хеффдинга гораздо более жесткая.

Существует ли аналогичная строгая оценка для |Икс|знак равно3 ?


Я верю, что вы можете изменить | X | в | X | -1, потому что «последний тип» в методах og types задается, как только вы знаете остальное.
Томас Але

Ответы:


6

Вы можете получить довольно хорошие оценки, рассматривая случайную переменную которая равна 1, если и ноль в противном случае (для начиная с испытаний и учетом категорий). При любом фиксированном независимы и , следовательно могут быть проанализированы с использованием Черновым границ. Тогда сделайте объединение, связанное по .YяJИксязнак равноJ1яN1J3JYяJΣяYяJJ

Если вышесказанного недостаточно, советую взглянуть на модель шаров и урн, например, в учебнике Упфала и Митценмахера. Эта модель такая же, как у вас, за исключением того, что некоторые из ваших мусорных ведер могут иметь больше шаров, чем другие, не так ли? В этой модели есть несколько более изощренных методов, использующих приближения Пуассона, которые, вероятно, будут распространяться на ваши установки с неоднородными вероятностями бина.


3

Нет ничего о границах Черноффа Хоффдинга, которые бы относились к булевым переменным. ЕслиИкс1,...,ИксN действительно ли случайные переменные имеют 0Икся1Вы можете применить границу Черноффа. Хорошим справочником является «Концентрация меры для анализа рандомизированных алгоритмов» ( http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.120.2561&rep=rep1&type=pdf ).


Меня интересуют категориальные, а не вещественные переменные, добавил уточнение
Ярослав Булатов
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.