Найти индексы дублированных строк [duplicate]
На этот вопрос уже есть ответ здесь:
Поиск ВСЕХ повторяющихся строк, в том числе «элементы с меньшими индексами » 3 ответаФункция, продублированная в R, выполняет поиск дублирующихся строк. Если мы хотим удалить дубликаты, нам нужно просто написатьdf[!duplicated(df),]
и дубликаты будут удалены из фрейма данных.
Но как найти показатели дублированных данных? Еслиduplicated
возвращает TRUE для некоторой строки, это означает, что это второй случай появления такой строки во фрейме данных, и его индекс может быть легко получен. Как получить индекс первого появления этой строки? Или, другими словами, индекс, с которым дублированная строка идентична?
Я мог бы сделать цикл для data.frame, но я думаю, что есть более элегантный ответ на этот вопрос.