Работая в качестве Data Scientist в одной из крупнейших консалтинговых компаний в мире, я могу просто дать свои два цента, один из которых полезен для такой работы, как моя. Все курсы классные и имеют приложения как в исследованиях, разработках, так и в консалтинге. Однако некоторые курсы могут быть более важными для практического применения. Отказ от ответственности: это не отражает мнение моего работодателя, и я также видел только несколько департаментов в Германии.
САМЫЕ ПОЛЕЗНЫЕ КУРСЫ:
- Введение во временные ряды
Если вы работаете в качестве Data Scientist, вы обязательно будете делать прогнозы время от времени. Важно, чтобы вы понимали такие закономерности, как тенденции, корни единиц, сезонность и т. Д.
На практике вы будете сталкиваться с данными с различной частотой, такими как ежемесячные или квартальные данные.
Прочитайте принцип и практику прогнозирования , чтобы получить представление о приложениях прогнозирования.
- Современное статистическое прогнозирование и машинное обучение
Этот курс повысит ваши шансы получить высокооплачиваемую работу. Машинное обучение соотносится с более высокими зарплатами, чем классическая статистика. Это определенно стоит знать такие вещи, как данные обучения и испытаний. Вы всегда будете строить модель и тестировать ее.
Это также связано с важностью машинного обучения, что эта страница называется CrossValidated. Хахаха
ТАКЖЕ ПОЛЕЗНО:
- Линейное моделирование: теория и приложения
- Введение в эконометрический анализ (перекрестная регистрация между Stats и Econ)
Эти курсы кажутся мне очень похожими. Я предполагаю, что оба в основном имеют дело с продольными данными и панельными данными. Однако большинство проблем регрессии, с которыми вы столкнетесь, когда Data Scientist будут иметь дело с временными рядами У меня только что был один проект с моделью выбора Хекмана / регрессией Тобита и некоторыми небольшими вещами, где я столкнулся с подсчетом данных и анализом выживания. Общие задачи классификации более распространены в моей компании, чем задачи регрессии.
Скорее всего, вы будете работать в команде с математиками, статистиками и компьютерными учеными. Они не будут придерживаться эконометрических моделей. Тем не менее, глубокое понимание линейных моделей и эконометрического анализа поможет вам справиться с временными рядами и проблемами прогнозирования.
Это также зависит от языка программирования, который вы предпочитаете. R (и даже более конкретно Stata) очень удобны для регрессионных моделей. Python довольно полезен для других задач.
Как уже говорил Майкл Черник, микроэконометрические проблемы широко используются в страховании. Если вы работаете в отделе страхования жизни, анализ выживания будет иметь решающее значение. Однако большинство исследователей данных не сталкиваются с такими задачами.
Вы можете пройти этот прикладной эконометрический базовый курс UCLA и подумать, насколько далеко вы столкнетесь с такими вопросами в своей будущей работе.
ДАЛЕЕ НЕУСТОЙЧИВЫЙ:
- Стохастические процессы (случайные блуждания, цепи Маркова с дискретным временем, пуассоновские процессы)
Это вряд ли будет полезно как Data Scientist. Может быть, вы можете столкнуться с такими моделями, если вы работаете в отделе количественных финансов банка.
Теория игр - это теоретическая концепция, которая практически не применяется на практике. В экономических и психологических исследованиях это может быть полезно, однако это не входит в классическую сферу данных ученого.
Пожалуйста, не стесняйтесь спрашивать, если я должен быть более конкретным о некоторых курсах.