Идеи проекта Data Science [закрыто]


23

Я не знаю, является ли это правильным местом для того, чтобы задать этот вопрос, но сообщество, посвященное Data Science, должно быть наиболее подходящим местом, по моему мнению.

Я только начал с Data Science и машинного обучения. Я ищу долгосрочные идеи проекта, над которыми я могу работать как 8 месяцев.

Сочетание науки о данных и машинного обучения было бы здорово.

Проект, достаточно большой, чтобы помочь мне понять основные концепции и одновременно реализовать их, был бы очень полезным.

Ответы:


27

Я бы попытался проанализировать и решить одну или несколько проблем, опубликованных на соревнованиях Kaggle ( https://www.kaggle.com/competitions ). Обратите внимание, что соревнования сгруппированы по их ожидаемой сложности , от 101(внизу списка) до Researchи Featured(вверху списка). Вертикальная полоса с цветовой кодировкой - это визуальное руководство для группировки. Вы можете оценить время, которое вы могли бы потратить на проект, скорректировав ожидаемую продолжительность соответствующего соревнования, основываясь на ваших навыках и опыте .

Ряд идей проекта по науке о данных можно найти на следующей Coursolveвеб-странице: https://www.coursolve.org/browse-needs?query=Data%20Science .

Если у вас есть навыки и желание работать над реальным научным проектом данных , ориентированным на социальные последствия , посетите DataKindстраницу проектов: http://www.datakind.org/projects . Другие проекты с акцентом на социальное воздействие можно найти на Data Science for Social Goodвеб-странице стипендии: http://dssg.io/projects .

Страница идей научного проекта на My NASA Dataсайте выглядит как еще одно место для посещения: http://mynasadata.larc.nasa.gov/804-2 .

Если вы хотите использовать открытые данные , этот длинный список приложений Data.govможет предоставить вам несколько интересных идей для проектов по науке о данных : http://www.data.gov/applications .


5

Возьми что-нибудь из своей повседневной жизни. Создайте предсказатель пробок в вашем регионе, создайте персонализированный музыкальный рекомендатель, проанализируйте автомобильный рынок и т. Д. Выберите реальную проблему, которую вы хотите решить - это не только сохранит вашу мотивацию, но и заставит вас пройти весь цикл разработки от сбора данных для проверки гипотез.


2
Получение данных часто является одной из самых сложных задач :)
Патлаф

2

Курс « Введение в Data Science» , который проводится на Coursera, теперь включает в себя проектные задания, в которых компании публикуют свои проблемы, и студентам предлагается их решить. Это делается через coursolve.com (уже упоминалось здесь).

Больше информации здесь (вы должны быть зачислены на курс, чтобы увидеть эту ссылку)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.