Что вы думаете о сертификатах Data Science?


35

Теперь я видел две программы сертификации в области науки о данных - одну из программ Джона Хопкинса, доступную на Coursera, и одну из Cloudera .

Я уверен, что есть и другие.

Набор классов Джона Хопкинса сфокусирован на R как на наборе инструментов, но охватывает ряд тем:

  • R Программирование
  • очистка и получение данных
  • Анализ данных
  • Воспроизводимые исследования
  • Статистические выводы
  • Модели регрессии
  • Машинное обучение
  • Разработка продуктов данных
  • И то, что выглядит как проектная задача завершения, похожая на Data Science Challenge от Cloudera

Программа Cloudera выглядит поверхностно, но, похоже, отвечает на два важных вопроса - «Знаете ли вы инструменты», «Можете ли вы применить инструменты в реальном мире». Их программа состоит из:

  • Введение в науку о данных
  • Экзамен по науке о данных
  • Задача Data Science (реальный сценарий проекта Data Science)

Я не ищу рекомендации по программе или сравнения качества.

Мне любопытно узнать о других сертификациях, темах, которые они освещают, и о том, насколько серьезно сообщество оценивает сертификаты DS.

РЕДАКТИРОВАТЬ: Это все отличные ответы. Я выбираю правильный ответ по голосам.


4
Это слишком широко и в первую очередь основано на мнении. Пожалуйста, посмотрите на datascience.stackexchange.com/help/dont-ask
asheeshr

3
@AsheeshR - мы усредняем 2 вопроса в день и 2 ответа на вопрос. На данный момент акцент должен быть сделан на поощрении участия и повышении интереса.
Стив Каллестад

10
Вовлечение за счет качества сайта не является решением. Вовлеченность временная. Качество гораздо сложнее изменить позже.
asheeshr

4
Велосипеды , Рабочее место , Личные финансы и деньги , Скептики , Разработка игр - все началось с менее чем 10 вопросов в день. Велосипеды были запущены с 4 в день, потому что это считалось сайтом высокого качества.
asheeshr

3
Ну ... Я думаю, я должен объявить вас победителем на этом этапе. :)
Стив Каллестад

Ответы:


13

Я сделал первые 2 курса, и я планирую сделать все остальные тоже. Если вы не знаете R, это действительно хорошая программа. Есть задания и викторины каждую неделю. Многие люди находят некоторые курсы очень сложными. Вам будет трудно, если у вас нет опыта программирования (даже если они говорят, что это не обязательно).

Просто помните .. это не потому, что вы можете водить машину, что вы пилот F1;)


32

Как бывший менеджер по аналитике и ведущий научный сотрудник, я очень подозреваю в необходимости сертификатов по науке о данных. Термин «ученый по данным» довольно расплывчат, а область науки о данных находится в зачаточном состоянии. Сертификаты подразумевают какой-то единый стандарт, которого просто нет в науке о данных, это все еще очень дикий запад.

Хотя сертификат, вероятно, не причинит вам вреда, я думаю, что ваше время будет лучше потрачено на развитие опыта, чтобы знать, когда использовать определенный подход, и глубины понимания, чтобы иметь возможность объяснить этот подход нетехнической аудитории.


2
Иногда трудно получить опыт, если ваша текущая работа сосредоточена не на науке о данных, а на какой-то смежной области (в моем случае статистика). Я использую курсы, чтобы получить некоторые знания и остаться в теме, что я не могу сделать в своей дневной работе.
Кристиан Зауэр

1
Я полностью согласен, что курсы очень ценны для того, чтобы дать вам отправную точку и некоторую структуру для получения этого опыта. Чтобы получить максимальную отдачу от Mooc, я предлагаю взять очень конкретный пример, скажем, логистическую регрессию, и реально проработать его с другим набором данных, двойной бонус, если вы делаете это на языке, отличном от того, на котором преподают курс .
neone4373

Это хорошая идея. Чего не хватает статистике в целом, так это учебному веб-сайту. Например, набор баз данных, а также цели и возможные результаты в конце. Что-то вроде ханкадемии, но более мощное;)
Кристиан Зауэр

11

Упомянутые вами программы сертификации - это курсы начального уровня. Лично я думаю, что эти сертификаты показывают только настойчивость человека, и они могут быть полезны только тем, кто подает заявку на стажировку, а не реальным работам по науке о данных.


Я согласен. Материал курса хорош для начала, но в основном это начальный уровень.
Шагун Содхани

10

Я возглавляю команды по науке данных для крупной интернет-компании, и я просмотрел сотни анкет и опросил десятки для наших команд по всему миру. Многие кандидаты прошли вышеупомянутые курсы и программы или имеют аналогичные полномочия. Лично я также прошел курсы, некоторые из них хорошие, другие разочаровывают, но ни один из них не делает вас «специалистом по данным».

В общем, я согласен с остальными здесь. Сертификат от Coursera или Cloudera просто сигнализирует об интересе, но не двигает иглой. Есть еще много вопросов для рассмотрения, и вы можете оказать большее влияние, предоставив полный репозиторий своей работы (например, профиль github) и установив контакты с другими учеными в области данных. Любой, кто нанимает профиль науки о данных, всегда предпочитает видеть вашу предыдущую работу и стиль / способности кодирования.


8

Существует несколько сертификаций, но они имеют разную направленность и стиль преподавания.

Я предпочитаю The Analytics Edge на eDX гораздо больше, чем специализацию Джона Хопкинса, поскольку она более интенсивна и практична. Ожидается, что в специализации Джона Хопкинса будет 3–4 часа в неделю против 11–12 часов в неделю на Analytics Edge.

С точки зрения отрасли, я воспринимаю эти сертификаты как знак интереса, а не уровень знаний, которыми обладает человек. В этих MOOC слишком много выбывших. Я ценю другой опыт (например, участие в соревнованиях Kaggle) гораздо больше, чем прохождение сертификации XYZ на MOOC.


2
А как насчет stats.SE, datascience.SE профилей. Как вы думаете, они могут многое сказать о соответствующем уровне знаний?
IharS

При чем тут отсевы? Предположительно, сертификация зависит от завершения курса, а не просто от регистрации…
Гала

Есть много людей, которые упоминают, что они проходят сертификацию, пройдя курс по этим MOOC. Вы должны быть осторожны с этим.
Кунал

@Kunal Это имеет смысл, но ваш ответ переходит от «сертификации» к «выбывшим» (которые, вероятно , не имеют сертификации ). Ключ здесь проходит . Это немного похоже на то, чтобы быть зарегистрированным в качестве студента или иметь учетную запись Kaggle. Ничто из этого не говорит нам, следует ли вам ценить кого-то, кто действительно получил степень, прошел курс или участвовал в конкурсе до конца.
Гала

6

Не уверен насчет первой эры облаков, но один из моих друзей присоединился к Джону Хопкинсу, и, по его словам, это «здорово, чтобы вы начали». Это также было рекомендовано многими людьми. Я планирую присоединиться к нему через несколько недель. Что касается серьезности, я не думаю, что эти сертификаты помогут вам устроиться на работу, но они наверняка помогут вам учиться.


4

@OP: Выбор ответов голосованием - САМАЯ ГЛАВНАЯ идея.

Ваш вопрос становится конкурсом популярности. Вы должны искать правильный ответ, я сомневаюсь, что вы знаете, что вы спрашиваете, знаете, что вы ищете.

Чтобы ответить на ваш вопрос: В
: насколько серьезно сообщество рассматривает сертификаты DS.

A: Какова ваша цель пройти эти курсы? Для работы, для школы, для самосовершенствования и т. Д.? Курсы Coursera очень полезны, вы не будете изучать теорию, они намеренно зарезервированы для установки в классе.

Тем не менее, курсы Coursera очень полезны. Я бы сказал, что это эквивалентно одному классу годового обучения по двухлетней программе магистратуры.

Я еще не уверен в его признании в отрасли, потому что проблема в том, как вы на самом деле взяли курс? Сколько времени вы провели? На этих курсах намного легче получить оценку «А», чем на экзамене на бумаге. Таким образом, будет существенное изменение качества от человека к человеку.


Часть вопроса предназначена для оценки того, оценило ли сообщество ценность сертификации. В некоторых областях сертификация является абсолютной необходимостью. В других случаях сертификация вообще не имеет значения. В третьих, сертификаты конкретной компании высоко ценятся, а конкурентные - нет. Другая часть предназначалась для понимания разницы в тематической направленности сертификаций, которые там существуют. Наука о данных - это широкий термин. Сертификаты, как правило, более сфокусированы. Это плохой вопрос для формата QA - это скорее дискуссия, в зависимости от мнения.
Стив Каллестад

Моя цель отметить, что я выбрал ответ голосованием, чтобы дать понять, что все ответы заслуживают прочтения. Все делают хорошие замечания, в том числе и вы здесь, внизу. Кто-то, кто интересуется этими вещами, не должен ограничивать себя одним или двумя основными ответами.
Стив Каллестад

Голосование за правильный ответ - ужасная идея. Это неправильный подход к математике. Вы явно не поняли мою точку зрения.
user13985

2

Я думаю, что эффект сертификации от Coursera зависит от человека, а также классов. Требование гласит: минимум 3-5 часов в неделю, если вы вкладываете больше материала, а материал открывается дольше, чем на 3-5 часов, тогда эти классы и сертификаты могут быть эквивалентны обширной базе знаний и опыту в этой области. , Наука приходит к тем, кто этого требует.


2

Я почти закончил со специализацией в области наук о данных Джона Хопкинса на Coursera (курс и контрольный камень оставлены для получения диплома). Я просто дам вам плюсы и минусы этого, стараясь сделать его максимально объективным:

Плюсы :

  • Структура вокруг учебного процесса
  • Со временем вы создадите портфолио

Минусы :

  • Для разных курсов нужны разные фоны. Первые несколько курсов не предполагают предыдущих знаний. В концептуальных курсах это внезапно становится непростым для понимания. (Статистический вывод, регрессионный анализ)
  • Преподавал 3 профессора. Я думаю, что они не на той же странице о своей потенциальной аудитории и их способностях / потребностях / интересах.

2

Лучший способ добиться успеха в том, чтобы получить работу, которую вы хотите, чтобы показать, что вы можете это сделать.

Упомянутые вами MOOC дадут вам хорошее представление об основах, и их должно быть достаточно, чтобы вы начали решать собственные проблемы машинного обучения / науки о данных. Попробуйте один или два конкурса Kaggle, это отличный способ улучшить свои навыки, и приличная оценка будет интересна потенциальному работодателю. Опубликуйте свои результаты на Github, используя что-то вроде iPython Notebook, что позволит легко увидеть и оценить вашу работу.

Попробуйте провести анализ других общедоступных наборов данных, таких как набор данных UCI Bike Sharing или набор данных UCI Diabetes Treatment, которые очень интересно попробовать, и покажите, что вы заинтересованы и готовы развивать свои навыки.


2

Это действительно зависит от авторитета учреждения, предоставляющего сертификат. Например, сертификация Data Science от компании, базирующейся в Гарварде, признана многими отраслевыми партнерами и может сделать хороший выбор. Вы не сказали, какой сертификат вы ищете?


1

Значение для студента, смешанная сумка. Платить несколько сотен долларов за программу или сто поп за курс - это мотиватор.

Я закончил одну серию из MITx. Это курс для выпускников, посвященный методам и инструментам, предназначенным для тех, кому необходимо «знать» некоторые детали. Этого достаточно, чтобы мне было удобно применять то, что я узнал.

Автономный курс HarvardX по методу направленного ациклического графа больше походил на аспирантуру по статистике по методу Иудеи Перл. В противном случае я бы давно не услышал об этом.

Серия HarvardX - это учебный лагерь для выпускников, предназначенный для ориентации нового ученика на набор инструментов и приложений R.

Серия BerkeleyX - это курс опроса для студентов, использующий специализированный класс Python, который является почти языком, специфичным для предметной области.

Что касается стоимости сертификатов, я могу только сообщить, что мой единственный связанный образовательный опыт был магистром по геофизике, и у меня было около года оплачиваемого опыта работы вне моей должностной инструкции (старший юрист банка).

Возможно, из-за сертификатов мне было отказано в «переоценке» по крайней мере на двух работах, о которых я знаю. Итак, мой совет: если у вас есть сертификат, не упоминайте его, если при публикации вакансии появляется слово «Excel».


1

Некоторые ресурсы по edX для курсов по науке о данных от Гарварда, Массачусетского технологического института, Microsoft и другие, которые могут представлять интерес для этой группы.

Например, у нас есть профессиональная программа сертификата от Гарварда , состоящей из 8 курсов и дипломный экзамен здесь .

Для более продвинутых исследований, у нас есть программа MicroMasters из MIT здесь .

а также один из Калифорнийского университета в Сан-Диего здесь . Для большого обзора Data Science у нас есть программа от Microsoft. Для всех наших программ вы можете проверить здесь .

Надеюсь это поможет,

Джош из edX

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.