Найти индексы дублированных строк [duplicate]
This question already has an answer here:
Finding ALL duplicate rows, including “elements with smaller subscripts” 3 answersФункция, продублированная в R, выполняет поиск дублирующихся строк. Если мы хотим удалить дубликаты, нам нужно просто написатьdf[!duplicated(df),]
и дубликаты будут удалены из фрейма данных.
Но как найти показатели дублированных данных? Еслиduplicated
возвращает TRUE для некоторой строки, это означает, что это второй случай появления такой строки во фрейме данных, и его индекс может быть легко получен. Как получить индекс первого появления этой строки? Или, другими словами, индекс, с которым дублированная строка идентична?
Я мог бы сделать цикл для data.frame, но я думаю, что есть более элегантный ответ на этот вопрос.