Удалите дубликаты, где значения меняются местами через 2 столбца в R [duplicate]
На этот вопрос уже есть ответ:
парное удаление дубликатов из фрейма данных [дубликаты] 4 ответаУ меня есть простой фрейм данных:
| id1 | id2 | location | comment |
|-----|-----|------------|-----------|
| 1 | 2 | Alaska | cold |
| 2 | 1 | Alaska | freezing! |
| 3 | 4 | California | nice |
| 4 | 5 | Kansas | boring |
| 9 | 10 | Alaska | cold |
Первые две строки дубликаты, потому чтоid1
а такжеid2
оба отправились на Аляску. Неважно, что их комментарии разные.
Как я могу удалить один из этих дубликатов? Любой из них можно удалить.
Я сначала пытался сортироватьid1
а такжеid2
, затем получите индекс, в котором они дублируются, затем вернитесь и используйте индекс для подстановки исходного df. Но я не могу справиться с этим.
df <- data.frame(id1 = c(1,2,3,4,9), id2 = c(2,1,4,5,10), location=c('Alaska', 'Alaska', 'California', 'Kansas', 'Alaska'), comment=c('cold', 'freezing!', 'nice', 'boring', 'cold'))