Многие люди используют основной инструмент, такой как Excel или другую электронную таблицу, SPSS, Stata или R, для своих статистических нужд. Они могут обратиться к какому-то конкретному пакету для очень особых нужд, но многое можно сделать с помощью простой электронной таблицы или пакета общей статистики или среды программирования статистики.
Мне всегда нравился Python как язык программирования, и для простых нужд легко написать короткую программу, которая рассчитывает то, что мне нужно. Matplotlib позволяет мне строить это.
Кто-нибудь полностью переключился, скажем, с R на Python? R (или любой другой пакет статистики) обладает множеством функций, специфичных для статистики, и имеет структуры данных, которые позволяют вам думать о статистике, которую вы хотите выполнить, и меньше о внутреннем представлении ваших данных. Преимущество Python (или другого динамического языка) в том, что я могу программировать на знакомом языке высокого уровня, и он позволяет мне программно взаимодействовать с реальными системами, в которых находятся данные или из которых я могу проводить измерения. Но я не нашел ни одного пакета Python, который позволил бы мне выражать вещи с помощью «статистической терминологии» - от простой описательной статистики до более сложных многомерных методов.
Что вы можете порекомендовать, если я хотел использовать Python в качестве «рабочего места для статистики» вместо R, SPSS и т. Д.?
Что бы я получил и потерял, основываясь на вашем опыте?