Мой друг предположил, что индустрии программного обеспечения в первую очередь нужны навыки работы с большими данными, а не навыки статистики как таковые.
Частично соглашаясь с комментарием вашего друга, я хотел бы отметить, что в любой отрасли инструменты больших данных выбираются, только если все V удовлетворены.
Я работаю руководителем отдела информационных технологий в ведущей компании поддержки клиентов. Здесь я занимаюсь взломом данных как для продукта, так и для роста компании.
Я в основном использую методы анализа временных рядов для прогнозирования оттока и анализа продаж. Это также включает в себя поведенческий анализ клиентов, конкуренции и отрасли.
Что касается продукта, мы используем ряд методов, начиная с анализа настроений с использованием LSTM, алгоритмов рекомендаций и т. Д.
Но основное внимание уделяется анализу временных рядов. Общий рабочий процесс будет:
- Очистка и формирование данных.
- исследовательский и пояснительный анализ, включающий определение сезонности, тенденций и циклов. Итак, нужно исследовать корреляции, автокорреляции и несколько одномерных и двумерных статистических данных; наряду с обширными графиками, включая кривые рассеяния, AFC, PAFC.
- Теперь наступает момент прогнозирования, где различные модели проверяются друг с другом, принимая шаг 2 в серьезное рассмотрение.
Инструменты, используемые мной: R, Python и Excel иногда.
И даже сочетание науки о данных и хакерского роста доказало свое волшебство в области маркетинга. Таким образом, спрос на статистиков и математических ботаников останется без изменений; и не собирается снижаться нигде в ближайшем будущем; особенно когда ориентированные на клиента стартапы процветают по всему миру.