Что вы хотите, чтобы ваш статистический разработчик делал?
Армия США говорит: «Тренируйся, ты будешь сражаться, потому что ты будешь сражаться так, как тебя тренировали». Проверьте их на то, что вы хотите, чтобы они делали весь день. Действительно, вы хотите, чтобы они «создавали ценность» или «зарабатывали деньги» для компании.
Босс 101
Думай "покажи мне деньги".
- Деньги растут на деревьях, называемых служащими. Вы кладете в «десять центов» (их зарплата), а они платят вам «четверть» (их стоимость).
- Если вы не можете связать их работу с тем, как они зарабатывают деньги для компании, то ни вы, ни они не выполняют свою работу правильно.
Примечание. Если ваш вопрос о символических манипуляциях не связан с «деньгами», то вы, возможно, задаете не тот вопрос.
Есть 3 вещи, которые каждый сотрудник должен сделать, чтобы стать сотрудником:
- Быть в состоянии сделать работу
- Хорошо работать с командой
- Быть готовым / мотивированным на самом деле делать работу
Если ты не получишь это, то никакой другой ответ не принесет тебе никакой пользы.
Если вы можете заменить их хорошим программным обеспечением или хорошо обученным подростком, то вам в конечном итоге придется это сделать, и это будет стоить вам.
Данные 101
Что они должны быть в состоянии сделать:
- использовать ваши внутренние разновидности программного обеспечения (сеть, ОС, офис, презентация и анализ)
- использовать некоторые отраслевые стандартные версии программного обеспечения (Excel, R, JMP, MatLab,
pick_three )
- получить данные сами. Они должны знать основные наборы данных для основных задач. Они должны знать репозитории. Они должны знать, какие известные данные используются для какой задачи. Фишер Айрис. Краб Пирсон. ... возможно, здесь есть 20 элементов. UCI, NIST, NOAA.
- Они должны знать правила обработки данных. Двоичные данные (T / F) имеют совсем другое информационное содержание, чем категориальные (A, B, C, D) или непрерывные. Правильная обработка данных по типу данных имеет важное значение.
- Несколько основных статистических задач включают в себя: являются ли эти два одинаковыми или разными (иначе
говоря, кластер / классификация), как это связано с этим (регрессия / подгонка, включая линейные модели, glm, радиальная основа,
разностные уравнения), верно ли, что «(проверка гипотез), сколько образцов мне нужно (приемочная выборка), как я могу получить наибольшее количество
данных из нескольких / дешевых / эффективных экспериментов (статистический дизайн
эксперимента) - отказ от ответственности, я инженер, а не статистик. Вы можете спросить их вопрос "каковы различные фундаментальные задачи и как вы проверяете, может ли статистика выполнять их эффективно и правильно?"
- получить доступ / использовать данные сами. Это о форматах и инструментах.
Они должны быть в состоянии читать из CSV, XLSX (Excel), SQL и
изображений. (HDF5, Rdata) Если у вас есть собственный формат, он должен
иметь возможность читать его и работать с инструментами быстро и
эффективно. Они должны знать силу / слабость формата. CSV - это быстрое использование, он был всегда, быстрый прототип, но раздутый, неэффективный и медленный.
- обрабатывать данные должным образом, используя лучшие практики, а не совершать грехи. Не выбрасывайте данные никогда. Не соединяйте биномиальные данные непрерывной линией. Не бросай вызов физике.
- придумать результаты, которые повторяемы и воспроизводимы. Некоторые
люди говорят, что «есть ложь, проклятая ложь и статистика», но не в моей
компании. Тот же хороший ввод дает тот же хороший вывод. Выходные данные не являются числом, это всегда бизнес-решение, которое информирует о
технических действиях и приводит к бизнес-результату. Различные тесты могут установить циферблат на 5,5 или 6,5, но возможность всегда выше 1,33.
- представить результаты на языке и на уровне, который
лица, принимающие решения, и / или разработчики миньонов, и / или сами могут
понять в течение года с наименьшими ошибками. Прекрасная вещь - это способность объяснить это, чтобы ваша бабушка поняла это. Это ( ссылка ) мой ответ, но мне это нравится.
Аналитические зингеры:
Я думаю, что невозможные вопросы - это здорово. Они невозможны по причине. Быть способным узнать, невозможно ли что-то за воротами, - это хорошо. Знание почему, наличие некоторых способов привлечь его или возможность задать другой вопрос может быть лучше.
Другие вопросы CV. ( ссылка ) На реддит. ( ссылка ) другие ( ссылка )
Кстати, это был хороший вопрос. Возможно, мне придется обновить этот ответ с течением времени.