Кто-нибудь может указать мне на обзорную статью о «Большой , Малый » результаты? Меня интересует, как эта проблема проявляется в различных исследовательских контекстах, например, регрессии, классификации, тесте Хотеллинга и т . Д.
Кто-нибудь может указать мне на обзорную статью о «Большой , Малый » результаты? Меня интересует, как эта проблема проявляется в различных исследовательских контекстах, например, регрессии, классификации, тесте Хотеллинга и т . Д.
Ответы:
Я не знаю ни одной статьи, но я думаю, что текущая книга с лучшим обзором методов, применимых к по-прежнему называется «Фридман-Хасти-Тибширани». Сжатие и лассо очень частые (я знаю по общему знакомому, что Вапник был расстроен при первом издании книги), но охватывает почти все распространенные методы сжатия и показывает их связь с Повышением. Говоря о повышении, опрос Buhlmann & Hothorn также показывает связь с усадкой.
У меня сложилось впечатление, что, хотя классификацию и регрессию можно анализировать с использованием одной и той же теоретической основы, тестирование для многомерных данных отличается, поскольку оно не используется в сочетании с процедурами выбора модели, а скорее фокусируется на частоте ошибок по семейным причинам. Не уверен насчет лучших опросов там. У Брэда Эфрона есть тонна бумаг / обзоров / книг на его странице . Прочитайте их все и дайте мне знать ту, которую я действительно должен прочитать ...
Что вы подразумеваете под «результатом» теоретического результата? или числовые результаты?
Мне нравятся обзоры Jianqing Fan, например, этот и этот по классификации (много цитат).
Также есть обзорная статья, в которой подробно описан обзор, см., Например, этот и этот .
Если вы хотите резюме, может быть, это лучшее, что вы можете получить
http://www.springer.com/statistics/statistical+theory+and+methods/book/978-3-642-20191-2
18-я глава Хасти, Тибширани и Фридмана (12-е издание / второе издание, этой главы не было в первом издании) - хороший обзор с некоторыми интересными наборами данных. Это не так тщательно, как их обработка старого материала, и большую часть времени им приходится давать несколько эвристические объяснения того, почему одни алгоритмы работают лучше, чем другие. Я нашел это очень полезным в сочетании с чтением статей для вещей, которые вы хотите узнать более подробно.