Одним из способов является обратная сортировка данных и использование duplicated
для удаления всех дубликатов. Для меня этот метод концептуально проще, чем те, которые применяются. Я думаю, что это должно быть очень быстро.
# Some data to start with:
z <- data.frame(id=c(1,1,2,2,3,4),var=c(2,4,1,3,5,2))
# id var
# 1 2
# 1 4
# 2 1
# 2 3
# 3 5
# 4 2
# Reverse sort
z <- z[order(z$id, z$var, decreasing=TRUE),]
# id var
# 4 2
# 3 5
# 2 3
# 2 1
# 1 4
# 1 2
# Keep only the first row for each duplicate of z$id; this row will have the
# largest value for z$var
z <- z[!duplicated(z$id),]
# Sort so it looks nice
z <- z[order(z$id, z$var),]
# id var
# 1 4
# 2 3
# 3 5
# 4 2
Изменить: я только что понял, что обратная сортировка выше даже не нужно сортировать по id
всех. Вы могли бы просто использоватьz[order(z$var, decreasing=TRUE),]
вместо этого, и это будет работать так же хорошо.
Еще одна мысль ... Если var
столбец числовой, то есть простой способ сортировки id
по возрастанию, но var
по убыванию. Это исключает необходимость сортировки в конце (при условии, что вы даже хотели, чтобы сортировка была выполнена).
z <- data.frame(id=c(1,1,2,2,3,4),var=c(2,4,1,3,5,2))
# Sort: id ascending, var descending
z <- z[order(z$id, -z$var),]
# Remove duplicates
z <- z[!duplicated(z$id),]
# id var
# 1 4
# 2 3
# 3 5
# 4 2