Я готовлюсь к вводному курсу по науке о данных с использованием языка программирования R. Моя аудитория - студенты, специализирующиеся на бизнес-дисциплинах. У типичного бизнес-старшекурсника нет опыта программирования, но он прошел несколько классов, в которых используется Excel.
Лично мне очень нравится R (или другие языки программирования), потому что я специализировался в области компьютерных наук. Тем не менее, у меня есть ощущение, что многие из моих учеников будут опасаться изучать язык программирования, потому что им это может показаться трудным.
Я немного знаком с Excel, и я считаю, что хотя Excel может быть полезен для простой науки о данных, студентам необходимо выучить серьезный язык программирования для науки о данных (например, R или Python). Как я могу убедить себя и студентов, что Excel недостаточно для серьезного бизнес-студента, изучающего науку о данных, и что им необходимо научиться программированию?
Отредактировано в ответ на комментарий
Вот некоторые из тем, которые я буду освещать:
- Обработка данных и очистка данных
- Как манипулировать таблицей данных, например, выбрать подмножество строк (фильтр), добавить новые переменные (мутировать), отсортировать строки по столбцам
- SQL присоединяется с использованием пакета dplyr
- Как рисовать графики (точечные, гистограммы и т. Д.) С помощью пакета ggplot2
- Как оценивать и интерпретировать статистические модели, такие как линейная регрессия, логистическая регрессия, деревья классификации и k-ближайшие соседи
Поскольку я не очень хорошо знаю Excel, я не знаю, можно ли легко выполнить все эти задачи в Excel.