Какие предметы по математике вы бы предложили для подготовки данных и машинного обучения?


30

Я пытаюсь составить самостоятельную учебную программу по математике, чтобы подготовиться к изучению интеллектуального анализа данных и машинного обучения. Это мотивировано тем, что я начал курс машинного обучения Эндрю Нга на Coursera и почувствовал, что перед тем, как продолжить, мне нужно улучшить свои математические навыки. Я недавно закончил колледж, так что моя алгебра и статистика (в частности, уроки политологии / психологии) ржавые.

Ответы в теме Является ли сильный фон в математике общим требованием для ML? предлагать только книги или занятия, непосредственно связанные с машинным обучением; Я уже изучил некоторые из этих классов и книг и не знаю точно, какую математику нужно изучать (например: в каком поле (ах) математического адреса получено уравнение для «минимизации функции стоимости»?). В другой предложенной ветке ( Навыки и курсовая работа должны были быть аналитиком данных ) упоминаются только широкие категории навыков, необходимых для анализа данных. Тема Введение в статистику для математиков не применяется, потому что у меня еще нет степени по математике; аналогичная тема Математик хочет, чтобы эквивалентные знания в степени качества статистики У меня невероятный список книг по статистике, но, опять же, я смотрю на начало математики с ржавого воспоминания об алгебре и оттуда.

Итак, для тех, кто работает в области машинного обучения и интеллектуального анализа данных, какие области математики вы считаете необходимыми для выполнения своей работы? Какие предметы по математике вы бы предложили для подготовки данных и машинного обучения, и в каком порядке? Вот список и порядок, который у меня пока есть:

  • Алгебра
  • Предварительное исчисление
  • Исчисление
  • Линейная алгебра
  • Вероятность
  • Статистика (здесь много разных подполей, но не знаю, как их разбить)

Что касается интеллектуального анализа данных и машинного обучения, то благодаря моей нынешней работе у меня есть доступ к записям о деятельности веб-сайта / приложения, транзакциях клиентов / подписок и данных о недвижимости (как статических, так и временных рядов). Я надеюсь применить интеллектуальный анализ данных и машинное обучение к этим наборам данных.

Спасибо!

РЕДАКТИРОВАТЬ:

Ради потомков я хотел поделиться полезной математической самооценкой для вводного курса Джеффри Гордона / Алекса Смолы по машинному обучению в CMU.


3
С точки зрения предпосылок для курсов Coursera, эта информация должна быть доступна где-то в их материалах. Вне их классов / в более общем плане, вопрос о том, какая математика вам нужна для stat / ML / DM, кажется мне дубликатом. В CV есть несколько тем, в которых описывается этот материал, в том числе: аналитик "Нужен сильный специалист по математике за мл" и " Требуется работа по анализу навыков, необходимых для работы с данными" ( возможно среди других).
gung - Восстановить Монику

1
Пожалуйста, просмотрите эти темы, темы, которые связаны между собой как тесно связанные, и, возможно, выполните поиск по сайту. Если после прочтения у вас все еще есть вопрос, вернитесь сюда и отредактируйте этот вопрос, чтобы сделать его более четким / точнее указать, что вам еще нужно знать, что не освещалось в других разделах.
gung - Восстановить Монику

Ответы:


15

Предложения, которые сделал @gung, безусловно, заслуживают внимания. Пройдя курс Coursera, я думаю, что ваш список - хорошее начало. Некоторые комментарии:

  1. линейная алгебра и матричная алгебра - это одно и то же, поэтому отбросьте последнее.
  2. В исчисление обязательно включите частичное дифференцирование. Это исчисление применяется к функциям более чем одной переменной (символически, если, скажем, является функцией от и тогда вы хотите а не ). К счастью, это не сложно.ZИксYZИксdZdИкс
  3. в исчислении вам не нужно ничего, кроме базовой интеграции (и, возможно, даже не этого). Это удачно, потому что интеграция трудна.
  4. добавить базовую оптимизацию, т. е. найти максимум или минимум функции, обычно функции более чем одной переменной. Оценка градиентного спуска, по крайней мере, имеет важное значение.
  5. с точки зрения сложности вы, вероятно, хотите быть где-то между началом и окончанием 1-го курса бакалавриата.
  6. Попробуйте прочитать некоторые основные тексты о вероятности и статистике, онлайн или иным образом, но не слишком переживайте (базовая математика является обязательным условием для понимания вероятности и статистики). Если вы пройдете несколько курсов, таких как предложенный вами, вы поймете, что вам нужно изучать и где лежат ваши интересы. Одна вещь, которую вы не хотите делать, по крайней мере на первый взгляд, это тратить много времени на изучение проверки гипотез. Вы бы предпочли понять основные статистические данные - случайные величины, распределения вероятностей (PFD, CDF), описательную статистику - и затем попытаться понять регрессию.

5

На этом форуме есть несколько отличных тем, включая ЭТОТ ОДИН, который я нашел особенно полезным для меня с точки зрения разработки концептуальной схемы важных навыков работы с данными.

Как уже упоминалось выше, доступно много онлайн-курсов. Например, у Coursera теперь есть специализация Data Science со множеством курсов, которые, вероятно, будут охватывать некоторые инструменты, необходимые для вашей работы.


3

Если вы хотите сосредоточиться на машинном обучении / интеллектуальном анализе данных, я настоятельно рекомендую оптимизацию / линейную алгебру / статистику и вероятность. Вот список книг для вероятности. Надеюсь, это поможет.


3

Что касается чистки очень очень базовых математических навыков, я использую эти книги:

Элементы математики для экономики и финансов. Mavron, Vassilis C., Phillips, Timothy N В этих книгах рассматриваются основные математические навыки (сложение, вычитание), частичное дифференцирование, интеграция, матрица и детерминанты, а также небольшая глава по оптимизации, а также дифференциальное уравнение. Он ориентирован на экономику и финансы, но это небольшая книга, последовательность глав удовлетворяет моим потребностям и легко читается для меня.

Статистический анализ: Microsoft Excel 2010. Конрад Карлберг Охватывает базовый статистический анализ, множественную регрессию и анализ ковариации, и использует Excel.

Открытие статистики с использованием Р. Энди Филда, Джереми Майлза, Зои Филд. Еще не читал это. Это использует R.

Элементарная линейная алгебра. Рон Ларсон, Дэвид С. Фальво.

Матричные методы: прикладная линейная алгебра Ричард Бронсон, Габриэль Б. Коста. охватывает элементарную линейную алгебру и матричное исчисление

Это основные учебники по математике, которые я использую для изучения данных / машинного обучения.

Надеюсь это поможет


3

Есть довольно много соответствующих ресурсы , перечисленные (и классифицированные) здесь , в так называемом «Open Source Data Science Masters».

Специально для математики они перечисляют:

  1. Линейная алгебра и программирование
  2. Статистика
  3. Дифференциальные уравнения и исчисление

Довольно общие рекомендации, хотя в них перечислены некоторые учебники, которые могут оказаться полезными.


2
  • Вероятность и статистика важны. Вот некоторые ключевые слова: проверка гипотез, многомерное нормальное распределение, байесовский вывод (совместная вероятность, условная вероятность), среднее значение, дисперсия, ковариация, расхождение Кульбака-Лейблера, ...
  • Базовая линейная алгебра необходима для машинного обучения. Темы, которые вы могли бы изучить, это разложение по собственным значениям и разложение по сингулярным числам. (Конечно, вы должны знать, как вычислить матричный продукт.)
  • Как уже упоминалось в TooTone: оптимизация важна. Вы должны знать, что такое градиентный спуск, и, возможно, взглянуть на метод Ньютона, Левенберга-Марквардта, Бройдена-Флетчера-Гольдфарба-Шанно.
  • Исчисление не так важно, но может быть полезно знать, как вычислять частные производные функций (матрица Якоби, матрица Гессе, ...), и вы должны знать, что такое интеграл.

0

Линейная алгебра, статистика, исчисление. Я думаю, что вы можете изучить их в тандеме с ML или даже после основ. Курсы / книги для начинающих отлично справляются с учебниками по математике, и вы изучаете основы математики, изучая ML. Я сделал эпизод подкаста по математике, необходимой для машинного обучения, и ресурсам для их изучения: Руководство по машинному обучению № 8


0

Перед началом любого курса машинного обучения пройдите следующий курс математики. Также не пытайтесь копать в одной попытке. Изучите основные понятия, затем снова освежите свои математические навыки и повторите: -

Математика Темы следующие: -

  • Линейная алгебра
  • Вероятность
  • Основное исчисление
  • Максимумы и минимумы функции
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.