Я хотел бы изучить теорию вероятностей, теорию мер и, наконец, машинное обучение. С чего мне начать? [закрыто]


9

Я хотел бы изучить теорию вероятностей, теорию мер и, наконец, машинное обучение. Моя конечная цель - использовать машинное обучение в программном обеспечении.

Я изучал исчисление и очень основную вероятность в колледже, но это почти все. Знаете ли вы какие-нибудь онлайн-курсы или книги, которые я мог бы использовать для изучения этих предметов. Я нашел много ресурсов в сети, но все они, похоже, нацелены на опытную аудиторию. Я знаю, что это займет некоторое время, но с чего начать, если я хотел бы учиться с самого начала?



2
Эти три вопроса, кажется, довольно хорошо охвачены дубликатами, перечисленными @General.
whuber

Ответы:


13

Я думаю, что есть два очень хороших и популярных справочника для вас (я начал с них, также имея опыт работы в области актуарной науки):

  1. Введение в статистическое обучение (с применением в R) Гарет Джеймс, Даниэла Виттен, Тревор Хасти, Роберт Тибширани. Он находится в свободном доступе на сайте, довольно всеобъемлющ и прост для понимания с практическими примерами. Вы можете начать изучать многие вещи даже без очень сильного статистического фона, этот справочник хорош для различных профилей и включает в себя достаточное количество популярных алгоритмов вместе с его реализацией на R, не углубляясь в математические детали.

  2. Элементы статистического обучения Тревора Хасти, Роберта Тибширани, Джерома Фридмана . По сравнению с первым, эта книга углубляется в математические аспекты, если вы хотите продолжить изучение конкретных алгоритмов, которые вы считаете полезными для вас. (это бесплатно )

И, конечно, Cross Validated является одним из лучших источников, где вы можете узнать много вещей, для меня: лучшие практики, статистическое недопонимание и неправильное использование и многое другое. После нескольких лет обучения в школах / университетах, а также самостоятельного обучения, я обнаружил, что мои знания слишком ограничены, когда я впервые пошел в Cross Validated. Я продолжаю ходить сюда каждый день с момента первого визита и многому учусь.


3
Если вам нравятся эти ссылки, следите за онлайн-курсами Стэнфорда. Т. Хасти и Р. Тибширани часто проводят курсы по машинному обучению.
Marcel 10

Я прочитал около 20% Введение в статистическое обучение с применением в R. Это именно то, что я искал. Отличная книга и довольно легко понять. Спасибо огромное! :)
Макс

6

Вот несколько бесплатных онлайн-курсов, которые, как я слышал, очень рекомендуются:

  • http://projects.iq.harvard.edu/stat110/home (В зависимости от вашего нынешнего комфорта в теории вероятностей. Курс доктора Блицштейна стал очень популярным в Гарварде даже для тех, кто не интересовался статистикой / вероятностью. Я наблюдал несколько лекций для моего собственного обзора и нашли их очень полезными.)
  • https://www.coursera.org/learn/machine-learning (Это текущая версия одного из первых массовых онлайн-курсов Стэнфорда Эндрю Нга, который в итоге стал одним из основателей Coursera. Я собирался пройти этот курс , но не было времени.)

5

вам не нужна теория измерения. Теория меры используется математиками для обоснования других математических процедур, например, определения пределов приближения интегралов. Большинство инженеров не изучали бы теорию мер, они просто использовали бы результаты. Математические знания, требуемые для ML, примерно характеризуются способностью интегрировать многомерный гауссов. Если вы уверены в этом, то, вероятно, у вас есть необходимые многовариантные исчисления, линейная алгебра и теория вероятностей.

Я бы порекомендовал Think Stats от Allen Downey - цель которого - научить программистов вероятности / статистике. Идея состоит в том, чтобы использовать опыт программирования для моделирования и, следовательно, понимать теорию вероятности / статистические методы. блог Аллена Дауни (он написал другие) Подумайте статистика (бесплатно) pdf )


4
(F,Ω,п)

@ Аксакал не только непрерывные процессы на мой взгляд!
Метариат

5

Так как вы интересуетесь машинным обучением, я бы пропустил вероятность и меру и прыгнул прямо в ОД. Курсы Эндрю Нга - отличное место для начала. Вы можете буквально закончить это через две недели.

Поиграйте с тем, что вы узнали за несколько недель, затем вернитесь к истокам и изучите некоторые вероятности. Если вы инженер, то я озадачен тем, как вам удалось поступить в колледж. Раньше был обязательным курсом в машиностроении. В любом случае, вы можете наверстать упущенное, пройдя курс MIT OCW здесь .

Я не думаю, что вам нужна теория измерения. Никому не нужна теория измерения. Те, кто делают, они не придут сюда, чтобы спросить, потому что их советник скажет им, какой курс выбрать. Если у вас нет советника, он вам точно не нужен. Тавтология, но это правда.

Дело в том, что с теорией меры вы не можете выучить ее с помощью «легкого чтения». Вы должны делать упражнения и задачи, в основном, делать это трудным путем. Это практически невозможно вне классной комнаты, по моему мнению. Лучший вариант здесь - пройти курс обучения в местном колледже, если они его предлагают. Иногда, курс вероятностей уровня доктора философии будет делать измерения и вероятности в одном классе, что, вероятно, является лучшим предложением. Я бы не рекомендовал посещать занятия по математике в отделе математики, если только вы действительно не хотите мучить себя, хотя в итоге вы будете очень довольны.


2

Для машинного обучения, я думаю, машинное обучение: искусство и наука об алгоритмах, которые осмысливают данные Питера Флаха, может быть хорошим источником для начала. Он дает общее введение в машинное обучение на интуитивно понятных примерах и подходит для начинающих. Мне особенно нравится эта книга из-за последней главы, в которой рассматриваются эксперименты по машинному обучению. При изучении машинного обучения недостаточно познакомиться с различными моделями, и нужно уметь сравнивать различные алгоритмы машинного обучения. Я думаю, что эта книга облегчила понимание того, как сравнивать эти алгоритмы. Слайды лекций можно найти здесь .


2

В дополнение к превосходным предложениям, приведенным выше, я хотел бы сказать, что если вы заинтересованы в том, чтобы получить четкое представление о более базовых понятиях вероятности и статистики, «От алгоритмов к Z-баллам: вероятностные вычисления в статистике» является отличным учебным пособием по использованию компьютеров для понять некоторые из наиболее важных понятий новичок / промежуточный в теории вероятностей и случайных процессов. Я также добавлю «Введение в статистическое обучение» или «Элементы статистического обучения» (ESL) в качестве введения в машинное обучение (ML). Я думаю, что ESL, в частности, удивителен, но он требует гораздо более сложного математического взгляда на концепции ML, поэтому, если вы считаете, что у вас все в порядке со статистикой, вы можете прочитать ее, как только получите больше опыт работы с ML.

Если вы заинтересованы в машинном обучении ради работы или решения проблем, ключевым моментом является получение практического опыта. Пройдите некоторое введение в курсы по науке о данных / машинному обучению. Эндрю Нг делает удивительное введение в машинное обучение в своем курсе в Coursera здесь . Я бы также предложил вам загрузить некоторые наборы данных и начать с ними играть. Если вы еще этого не сделали, загрузите R и RStudio (на мой взгляд, более дружелюбны для начинающих, чем Python или Matlab) и зарегистрируйтесь на kaggle и некоторые из их проблем для новичков. У них есть отличные пошаговые руководства, которые могут помочь вам использовать ML, практически не имея представления о том, что на самом деле происходит, но он дает вам представление о том, какие шаги вам необходимо предпринять для фактической реализации решения ML.

Я лично рекомендовал бы начать с использования инструментов ML, не зная, что они делают (используя наборы данных Kaggle или аналогичные); и изучение фундаментальных понятий, таких как перекрестная проверка, переоснащение, использование матриц путаницы, различные измерения того, насколько хороша модель, и т. д. Для меня гораздо важнее знать, как использовать алгоритмы, и знать, как определить, когда что-то работает / не работают, чем понять, как работают алгоритмы.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.