Я ищу способ сделать эквивалент SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
Сравнение pandas sql ни о чем не говорит distinct
.
.unique()
работает только для одного столбца, поэтому я полагаю, что могу объединить столбцы или поместить их в список / кортеж и сравнить таким образом, но похоже, что панды должны делать более естественным образом.
Я упускаю что-то очевидное или нет способа сделать это?
df.apply(pd.Series.unique)
но это не сработает, если количество уникальных значений варьируется в зависимости от столбца, поэтому вам придется создать dict из имен столбцов в качестве ключей и уникальных значений в качестве значений