Ответы:
Если вы хотите книгу, ориентированную на приложения, рассмотрите машинное обучение на основе моделей Кристофера Бишопа . У него есть больше технических книг, которые хорошо ценятся.
Если вы ищете много кода, вариант вероятностного программирования и байесовских методов для хакеров .
Еще одна вводная книга с более статистическим уклоном - «Введение в статистическое обучение с приложениями в R» . Опять же, у авторов есть уважаемая техническая версия книги.
У меня был тот же вопрос несколько недель назад.
Я лично нашел Python для анализа данных О'Рейли очень полезным в изучении основ. В книге предполагается, что у вас есть некоторый опыт программирования на python, но есть также приложение в конце, чтобы пройти через основы.
Автор вначале дает вам множество примеров из реального мира (не Monty Python), которые вы можете создать в первых нескольких главах, а затем подробно расскажет о каждой вещи в ходе работы над книгой, создавая свои знания.
Я нашел инструкции очень легко и шаг за шагом. Мой профессор, который является моим гидом во всем этом, был впечатлен тем, как быстро я научился.
Я также слышал хорошие вещи о Kaggle.
Data Science in the Cloud с Microsoft Azure Machine Learning и R - это бесплатный учебник, который подробно рассматривает пример. Не откладывай на конкретные инструменты, которые тебе нужны, потому что они тебе не нужны, чтобы извлечь пользу из книги.
Еще один, который мне понравился, - « Программирование коллективного разума», в котором также подробно рассматривается ряд проектов, в том числе веб-скребковая часть, которую закрывают большинство книг.
Я могу порекомендовать эту коллекцию ноутбуков Ipython, которая включает в себя записные книжки с комментариями по науке о данных, статистике и машинному обучению.
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
В одном месте вы можете найти интересные пошаговые объяснения - учебник Kaggle и интервью с победителями . Часто люди публикуют подробное резюме своего подхода.
Одна из лучших книг, которые мне попадались, - « Машинное обучение на Python» от Себастьяна Рашки. Простые примеры, пошаговое объяснение и правильное количество математики.
Структура книги охватывает весь процесс от очистки данных до объединения и оценки.
Посмотри на :
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
Это пошаговое руководство, которое даст вам представление обо всем процессе исследования данных, анализа данных и построения прогнозной модели.
Объяснение относительно изучения данных и разработки функций (как выбрать соответствующие функции) находится здесь:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
Посмотрите первые 5 наборов данных здесь, которые имеют учебные пособия и работают над ними, чтобы получить практический опыт:
Также посмотрите на:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
где он использует несколько моделей в одном наборе данных, что даст вам базовый уровень понимания различных моделей.
Чтобы узнать больше о выборе модели, взгляните на это:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
Приведенная выше ссылка содержит ответы людей, работающих в этой области.
Чтобы получить представление о различных наборах данных, вы всегда можете войти в kaggle и пройти соревнования и взглянуть на широкий набор наборов данных, где у вас есть доступ к коду людей в ядрах. Форумы в Kaggle полезны, поскольку люди обсуждают использование различных моделей для решения проблем и их подход.