Какие области математической статистики являются высоко пригодными для использования?


13

Я собираюсь закончить свои отличия в области статистики, и я действительно хочу получить докторскую степень, потому что я нахожу математическую статистику чрезвычайно интересной. Области исследований, в которых я больше всего хочу получить докторскую степень, - это случайные процессы и временные ряды.

Однако я также хочу продолжить карьеру в частном секторе после получения степени доктора философии. Мне было интересно, какие области математической статистики наиболее часто используются в частном секторе и на каких типах рабочих мест?

Очевидно, что я не собираюсь защищать докторскую диссертацию только потому, что она может быть принята на работу, но я чувствую, что это определенно то, что мне нужно рассмотреть, и поэтому я хотел бы получить совет.


4
Добро пожаловать в резюме! На этом сайте нет необходимости говорить «спасибо» в конце вашего поста - поначалу это может показаться грубым, но это часть философии этого сайта ( тура ) «Задавать вопросы, получать ответы, не отвлекаться» и это означает, что будущие читатели вашего вопроса не должны читать шутки. Точно так же нет необходимости подписывать свое имя - ваше имя пользователя и ссылка на вашу страницу автоматически отображаются внизу каждого сообщения
Silverfish

6
Вопрос, который вы должны задать: «Какие области будут востребованы через 5-6 лет?» Правильный ответ: «Мы понятия не имеем».
Аксакал

@Aksakal, этот вопрос не должен быть разрешен в резюме, так как он будет основан на мнении, как вы правильно указали. Ответы на этот вопрос должны быть объективными и, по возможности, основываться на статистике занятости. Бюро статистики труда в США может послужить хорошим началом для ОП.
StatsStudent

2
Я заметил, что здесь есть некоторая разница между вопросом, который, кажется, фокусируется на темах математической статистики, и ответами, которые в основном фокусируются на навыках . Я не уверен, так ли это, потому что вопрос не совсем ясен относительно того, чего он хочет, люди не читают вопрос, или это способ людей сказать, что навыки важнее тем!
Серебряная

2
@ Silverfish, что, если ответы неправильные? В результате ОП потеряет 6 лет своей жизни. Это такая высокая цена, что я бы даже не попытался ответить ему. Это также должно сказать ему, что, возможно, он вообще не должен задавать этот вопрос. Может быть, он должен выбрать область, которая ему наиболее интересна. Его жизнь не собирается останавливаться на 6 лет доктора философии. Важно, что он живет эти годы, наслаждается тем, что он делает. Кто знает, как долго мы на этой Земле, каждый момент имеет значение
Аксакал

Ответы:


22

Я отвечаю как человек, который регулярно оценивает и нанимает ученых данных.

Как человек, переходящий от академического образования к карьере в частном секторе, вы не будете наняты на основании каких-либо конкретных навыков, которые у вас есть. Мир академических исследований в области статистики и область проблем любой конкретной компании слишком обширны, чтобы их нанимать на основе очень точно определенных специфических навыков.

Вместо этого вас нанимают, потому что вы можете продемонстрировать общую склонность к точному мышлению, жажду и талант к решению проблем, способность понимать и передавать абстрактные и сложные идеи, а также разнообразный набор практических и теоретических навыков.

Итак, мой совет, и я всего лишь один парень, делайте то, что вы любите, и развивайте жажду решения проблем, нюансов и сложности. Изучите разнообразные навыки и хорошо изучите основы (лучше, чем тема исследования)

Ох, и научиться программировать.

Это имеет большой смысл, большое спасибо за вдумчивый ответ. Есть ли какие-то конкретные языки программирования, которые вы бы порекомендовали

Трудно ответить на вопрос, не будучи самоуверенным.

Мое личное мнение таково, что это на самом деле не имеет значения, поэтому изучайте то, что вам нравится, и это побуждает вас продолжать учиться. Очень хорошо выучить свой родной язык - это большое препятствие. После первого изучения другого (и другого, и другого) становится намного, намного легче, потому что вы уже столкнулись с трудными концептуальными проблемами.

Но выучите язык хорошо , изучите, как работает язык и почему он был разработан таким, каким он был. Напишите чистый код, к которому вы не боитесь возвращаться. Воспринимайте написание кода как серьезную ответственность, а не как печальную реальность. Это делает его более полезным и реальным навыком, который вы можете рекламировать.

Если вам все еще нужен конкретный совет, я бы повторил @ssdecontrol, предпочитая язык общего назначения, который может выполнять статистику, а не язык статистики, который может (своего рода) делать общее назначение.


3
@Patty Знание языка общего назначения является большим преимуществом для технологических компаний, потому что оно позволяет вам «говорить на одном языке» с разработчиками. Python - отличный выбор, потому что вы можете использовать его и для анализа данных, и это отличное введение в «реальное» программирование. SAS не будет ценным за пределами огромных предприятий. И независимо от того, куда вы идете, вам, вероятно, нужно знать некоторый SQL. Сценарии оболочки также являются хорошим инструментом, по крайней мере, знать.
Shadowtalker

4
В связи с программированием и реальным решением проблем, одной из рекомендаций было бы убедиться, что вы можете справиться с некоторыми проектами с помощью «сырых» данных (т.е. не все собранные и предварительно обработанные для вас). Если вы сможете выполнять синтез / очистку / контроль качества данных по мере необходимости, тогда ваши навыки программирования будут хорошо подготовлены на любом языке, который вы выберете.
GeoMatt22

2
«Мир академических исследований в области статистики и область проблем любой конкретной компании слишком обширны, чтобы их нанимать на основе очень точно определенных специфических навыков». Да и нет. Вы определенно можете получить работу без какого-либо определенного набора статистических навыков (например, доктора философии, безусловно, достаточно, независимо от темы исследования), но также вы можете быть активно набраны для определенного набора навыков. Как анекдот, я знаю кого-то, кто отклонил 4 отдельных предложения от Google, потому что они заинтересованы в его работе.
Клифф AB

2
@CliffAB Это честно. Но я думаю , это ошибка в кошельке глубокого изучения чего - то просто так , что компания будет активно вербовать вас.
Мэтью Друри

2
Ха-ха, о "глубоком изучении", Мэтью: Я уверен, что человек @CliffAB знает, кто получил четыре предложения от Google, работает над углубленным изучением.
говорит амеба, восстанови Монику

4

Если вы интересуетесь навыками, которые «пригодны для продажи», я бы сказал, что вы узнаете о различных методах моделирования (GLM, модели выживания, как непрерывных, так и дискретных, случайные леса, повышенные деревья) с акцентом на прогнозирование по сравнению с оценкой. Математическая статистика может иногда слишком увязать в оценках в параметрических моделях, пытаясь ответить на вопросы, которые становятся неактуальными, когда модель буквально не соответствует действительности. Поэтому, прежде чем углубляться в проблему, подумайте, действительно ли она все еще интересна и применима, когда модель не подходит, потому что она никогда не будет. Вы должны быть в состоянии найти много таких вопросов в области временных рядов, если в этом и заключается один из ваших интересов.

Также учтите, что в анализе реальных данных существуют проблемы, к которым может не подготовить вас само статистическое образование, поэтому я хотел бы рассмотреть возможность дополнения вашего образования изучением таких тем, как реляционные базы данных и общие вычисления. Эти поля также могут быть очень увлекательными и предлагают свежий взгляд на данные.

Наконец, как уже указывал Мэтью Друри, важно уметь программировать. Я хотел бы стать сильным с R и / или Python и начать изучать SQL, с которым вы неизбежно столкнетесь. Многие компании все еще используют SAS, но вы действительно хотите работать на одну? Скомпилированный язык, такой как C или Java, также не повредит, но это не очень важно.


1
Я определенно согласен с тем, что «все модели не правы, некоторые модели полезны». Однако согласны ли вы с тем, что может быть полезна формулировка механистических объяснительных (порождающих) моделей, которые могут включать скрытые (ненаблюдаемые) параметры? Например, при определении стратегий генерации / сбора данных. У меня сложилось впечатление, что это, возможно, (мягкое?) Разделение между статистикой и машинным обучением. Или я могу ошибаться. (Я работаю в отрасли, но технически не «ученый данных».)
GeoMatt22

3

Как человек, который провел свою постдокторскую карьеру в промышленности, я бы сказал это.

  1. Ответ Мэтью Друри - первый. Замечания dsaxton по прогнозированию и оценке также хороши.
  2. Научитесь программировать, используя то, что поможет вам быстро пройти аспирантуру. Получите хорошее в этом. Если вы хорошо владеете одним языком, другие легко найти, и вы, вероятно, можете сделать это за счет своего работодателя.
  3. Базы данных не станут меньше и, вероятно, не станут чище. Я бы предсказал, что методы работы с гигантскими, грязными / отсутствующими данными - достойная ставка в течение следующих двух или трех десятилетий.

2

Большинство текущих ответов ориентированы на «науку о данных», которая определенно является областью с высокой степенью занятости. Поскольку в первоначальном плакате упоминается особый интерес к случайным процессам и временным рядам, еще одной областью математической статистики *, которая может иметь значение, является оценка в пространстве состояний .

Это используется для оценки моделей, в которых система развивается благодаря обратной связи между высоко структурированными (квази) детерминированными процессами и стохастическим воздействием. Например, оценка состояния пространства вездесуща в автономных транспортных средствах .

(* Эта область обычно считается частью инженерной или других областей , но, безусловно, включает математическую статистику.)


1

Я бы не стал предлагать что-то принципиально новое, но я, как профессиональный сборщик данных, хотел бы подчеркнуть несколько моментов.

  1. Все рыночные навыки - это не просто набор отдельных изолированных навыков, но они представляют собой целый синхронизированный пакет. И под пакетом, я имею в виду,

  2. Набор практических навыков, с чрезвычайно высоким уровнем мастерства. Как вы можете сформировать осмысленное суждение, учитывая кучу данных. А для парня с уровнем PhD (или для любого, кто приходит к ним) работодатели были бы более заинтересованы в обеспечении реального когнитивного соответствия, которое вы можете привести с данным набором данных. Чтобы уточнить, в качестве примера,

  3. Набор навыков, которые вы можете использовать для извлечения данных из API, написания кодеков и драйверов в процессе, если вы обнаружили, что процесс неприступен до такой степени, что вы не сможете задействовать весь свой потенциал для этого. Затем используются элементы статистического анализа для преобразования данных в информацию. Этот процесс настолько сырой и настолько аутентичный, что чем разнообразнее и глубже вы изучаете, тем лучше информацию (ы) вы можете извлечь. Однажды мне сказали, что овладеть математикой, которая может дать ответ на проблему, - это одно, а интерпретировать этот ответ в реальном мире - это просто еще один навык.

  4. И, наконец, что чрезвычайно важно, можете ли вы представить визуализации своих выводов, чтобы все могли их увидеть и понять без того, чтобы кто-либо, не относящийся к вашей области, не задавал более 3 дополнительных вопросов. И именно здесь вы будете приводить свою аналогию с реальными процессами. Это немного сложно, но когда-то освоено, оно обычно приносит хорошие дивиденды на протяжении всей вашей карьеры.

Для всего этого, с моей точки зрения, полезный совет - постоянно спрашивать себя при изучении новых вещей, как это можно использовать в реальном мире. Да, иногда становится неловко, когда кто-то углубляется в абстракции, но, тем не менее, эта привычка очень стоит того, и часто она отделяет сверхработоспособного от просто высокообразованного. Удачи!

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.