Удалить все повторяющиеся строки в Python Pandas
pandas
drop_duplicates
Функция отлично подходит для "унификации" данных. Тем не менее, один из ключевых аргументов для передачи являетсяtake_last=True
или жеtake_last=False
в то время как я хотел бы отбросить все строки, которые являются дубликатами в подмножестве столбцов. Это возможно?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
Как пример, я хотел бы отбросить строки, которые соответствуют столбцамA
а такжеC
так что это должно отбросить строки 0 и 1.