Панды: удалить все записи дубликатов индексов
У меня есть набор данных с потенциально дублирующимися записями идентификатораappkey
, Дублированные записи в идеале не должны существовать, и поэтому я считаю их ошибками при сборе данных. Мне нужно отбросить все случаиappkey
что происходит более одного раза.
drop_duplicates
Метод в этом случае бесполезен (или это так?), так как он выбирает первый или последний из дубликатов. Есть ли очевидная идиома для достижения этого с пандами?