У меня есть опыт работы в области компьютерного программирования и теории элементарных чисел, но я не изучал реальную статистику, и недавно «обнаружил», что удивительный мир целого ряда методов на самом деле является статистическим миром. Кажется, что матричные факторизации, матричное пополнение, многомерные тензоры, вложения, оценка плотности, байесовский вывод, марковские разбиения, вычисления по собственным векторам, PageRank - все это высоко статистические методы, и что алгоритмы машинного обучения, использующие такие вещи, используют много статистики ,
Моя цель - иметь возможность читать статьи, в которых обсуждаются такие вещи, а также реализовывать или создавать алгоритмы, понимая при этом обозначения, «доказательства» и используемые статистические аргументы. Полагаю, самое сложное - это следовать всем доказательствам, связанным с матрицами.
Какие основные документы могут помочь мне начать? Или хороший учебник с упражнениями, которые стоит пройти?
В частности, некоторые статьи, которые я хотел бы полностью понять:
- Завершение точной матрицы с помощью выпуклой оптимизации, Candes, Recht, 2008
- Быстрое преобразование Коши и быстрая робастная линейная регрессия, Clarkson et al, 2013
- Случайные проекции для машин опорных векторов, Пол и др., 2013
- Высокомерная оценка вероятности с использованием моделей с большой плотностью, Rippel, Adams, 2013
- Получение оценок, минимизирующих ошибки, и универсальных оценок ошибок при вводе для заполнения матрицы низкого ранга, Király, Theran, 2013