У меня есть фрейм данных с повторяющимися значениями в столбце A. Я хочу удалить дубликаты, сохранив строку с самым высоким значением в столбце B.
Итак, это:
A B
1 10
1 20
2 30
2 40
3 10
Должен превратиться в это:
A B
1 20
2 40
3 10
Уэс добавил несколько приятных функций для удаления дубликатов: http://wesmckinney.com/blog/?p=340 . Но AFAICT, он предназначен для точных дубликатов, поэтому нет упоминания о критериях выбора, какие строки будут сохранены.
Я предполагаю, что, вероятно, есть простой способ сделать это - возможно, такой же простой, как сортировка кадра данных перед удалением дубликатов - но я недостаточно хорошо знаю внутреннюю логику groupby, чтобы понять это. Какие-либо предложения?