Статистические алгоритмы модели запросов?


13

Я задал этот вопрос в перекрестной проверке вопросов и ответов, но, похоже, он связан с CS гораздо больше, чем со статистикой.

Можете ли вы привести примеры алгоритмов машинного обучения, которые изучают статистические свойства набора данных, а не отдельные наблюдения, то есть используют статистическую модель запросов ?


1
что такое статистическая модель запроса?
Суреш Венкат

из статьи Кернса portal.acm.org/citation.cfm?doid=293347.293351 : «в этой модели алгоритму обучения запрещено изучать отдельные примеры неизвестной целевой функции, но предоставляется доступ к оракулу, предоставляющему оценки вероятностей по выборке пространство случайных примеров. извините, если это не очевидно, я обновил свой вопрос со ссылкой на статью
Deyaa

Ответы:


14

Почти каждый алгоритм, который работает в модели PAC (за исключением алгоритмов обучения четности), может быть настроен для работы в модели SQ. Смотрите, например, эту статью Blum et al. в котором несколько популярных алгоритмов переведены в их SQ-эквиваленты ( Practical Privacy: платформа SuLQ ). Документ в принципе касается "конфиденциальности", но вы можете проигнорировать это - на самом деле это просто реализация алгоритмов с SQ-запросами.

Агностическое обучение, с другой стороны, намного сложнее в модели SQ: помимо вычислительных проблем (хотя они важны), сложность выборки, необходимая для агностического обучения, примерно такая же, как и для точного обучения, если у вас действительно есть доступ к данные указывают. С другой стороны, независимое обучение становится намного сложнее в модели SQ - вам, как правило, нужно делать суперполиномиально много запросов, даже для таких простых классов, как монотонные дизъюнкции. См. Эту статью Фельдмана ( Полная характеристика статистического обучения запросов с приложениями к эволюционируемости ) или эту недавнюю работу Gupta et al. ( Частное высвобождение конъюнкций и барьер статистического запроса )


действительно хороший ответ Аарон :) большое спасибо :)
Deyaa

7

Модель SQ была создана для анализа помехоустойчивого обучения, а именно алгоритм, который работает путем создания статистических запросов, будет работать в условиях классификации шума. Как сказал Аарон, большинство алгоритмов PAC, которые у нас есть, имеют эквиваленты в модели SQ. Единственное исключение - исключение Гаусса, которое используется в паритетах обучения (можно даже использовать его умное применение).изучить log (n) loglog (n) размерных соотношений в модели классификации шума). Мы также знаем, что четности не могут быть изучены с помощью статистических запросов, и оказывается, что наиболее интересные классы, такие как деревья решений, могут моделировать функции четности. Итак, в нашем стремлении получить алгоритмы обучения PAC для многих интересных классов (таких как деревья решений, DNF и т. Д.), Мы знаем, что нам нужны принципиально новые алгоритмы обучения, которые не работают в статистической модели запросов.


Интересный. У вас есть ссылка, что паритеты не могут быть изучены в модели SQ?
М. Алагган

1
это было доказано Кернсом в его оригинальной статье, определяющей модель: portal.acm.org/citation.cfm?doid=293347.293351, а затем снова показано Blum и др., где они определили измерение SQ класса portal.acm.org/citation .cfm? id = 195058.195147 . По сути, аргумент выглядит следующим образом: четности являются «попарно независимыми» относительно равномерного распределения, так что вам, скорее всего, нужно угадать правильную четность, чтобы чему-то научиться, и существует множество возможных
четностей

5

Я хотел бы немного уточнить ответ Аарона. Почти каждый агностический алгоритм (опять же, за исключением всего, что использует исключение Гаусса) может быть настроен для работы в модели SQ. Естественно, агностическое обучение сложнее, чем неагностическое, но это самостоятельный вопрос.


/ε2
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.