Я использую панд в качестве заменителя БД, так как у меня есть несколько баз данных (oracle, mssql и т. Д.), И я не могу сделать последовательность команд в эквиваленте SQL.
У меня есть таблица, загруженная в DataFrame с несколькими столбцами:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
В SQL для подсчета количества разных клиентов в год было бы:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
И результат будет
201301 5000
201302 13245
Как я могу сделать это в пандах?
value_counts
может быть ответ, который вы ищете: pandas.pydata.org/pandas-docs/stable/generated/…