По твоему вопросу я не могу сказать, насколько хорошо ты разбираешься в математике или где останавливается твое обучение. Я предполагаю, что, поскольку вы инженер по программному обеспечению, вы знакомы с алгеброй, геометрией и, возможно, с некоторыми исчислениями.
Я бы порекомендовал вам начать обучение с изучения статистики и понимания таких понятий, как описания, анализ данных, корреляция, распределение и так далее. Я вижу, что вы предпочитаете книги, а не видео, поэтому я буду встречаться с вами на полпути и предоставлю вам несколько книг, которые есть в Интернете, а также одну или две книги, которые вы можете купить в печатном виде.
Во-первых, я бы порекомендовал учебную программу онлайн-курса Penn State по статистике . Вы можете изучить каждый из их курсов, используя меню слева. Как только вы выберете курс, прокрутите вниз на веб-странице курса и нажмите на ссылку, которая гласит «онлайн заметки курса». Примечания к курсам для этих курсов гораздо больше, чем примечания и читаются как полные книги. Они очень поучительны. Кроме того, ознакомьтесь с учебной программой онлайн-курса для студентов Penn State по статистике , если вы найдете в выпускной работе что-то слишком сложное и хотите получить «более простое» объяснение.
Во-вторых, просмотрите Справочник по биологической статистике Джона Х. Макдональда. Не позволяйте названию обмануть вас; Эта книга является отличным учебником по статистике и анализу данных, применимым к любой области.
В-третьих, просмотрите «Небольшой справочник статистики » Джерарда Даллала. Опять же, не позволяйте названию обмануть вас; Эта книга - еще одна жемчужина, которая проведет вас через некоторые важные основы статистики.
В-четвертых, прочитайте книгу Аллена Дауни « Think Stats ». В Интернете есть бесплатная версия более ранней версии; самое последнее издание, которое вам придется купить. Хотя это того стоит, особенно если вы работаете в Python. В этой книге автор обучает вас статистике и анализу данных с использованием Python для анализа реальных (игрушечных) наборов данных. Это действительно отличная книга для проработки.
Наконец, ознакомьтесь с Data Science from Scratch от Джоэля Груса. Эта книга больше фокусируется на анализе данных (а не на основах статистики) и уделяет больше внимания машинному обучению и моделированию. Он использует Python (и стек данных Python), чтобы помочь вам проанализировать и провести прогнозную аналитику в реальных (игрушечных) наборах данных. Еще одна замечательная книга для проработки.