pandas
drop_duplicates
Функция отлично подходит для «uniquifying» в dataframe. Тем не менее, одним из ключевых аргументов для передачи является take_last=True
или take_last=False
, хотя я хотел бы отбросить все строки, которые являются дубликатами, в подмножестве столбцов. Это возможно?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
В качестве примера я хотел бы удалить строки, которые совпадают в столбцах, A
и C
поэтому следует удалить строки 0 и 1.