R - найти все уникальные значения среди подмножеств фрейма данных
У меня есть фрейм данных с двумя столбцами. Первый столбец определяет подмножества данных. Я хочу найти все значения во втором столбце, которые появляются только в одном подмножестве в первом столбце.
Например, из:
df=data.frame(
data_subsets=rep(LETTERS[1:2],each=5),
data_values=c(1,2,3,4,5,2,3,4,6,7))
data_subsets data_values
A 1
A 2
A 3
A 4
A 5
B 2
B 3
B 4
B 6
B 7
Я хотел бы извлечь следующий кадр данных.
data_subsets data_values
A 1
A 5
B 6
B 7
Я играл сduplicated
но я просто не могу заставить его работать. Любая помощь приветствуется. Существует ряд тем, посвященных решению подобных проблем, надеюсь, я не упустил из виду ответ в моих поисках!
EDIT
Я изменил подход @Matthew Lundberg к подсчету количества элементов и извлечению из фрейма данных. По какой-то причине его подход не работал с фреймом данных, который у меня был, поэтому я придумал это, что не так элегантно, но выполняет свою работу:
counts=rowSums(do.call("rbind",tapply(df$data_subsets,df$data_values,FUN=table)))
extract=names(counts)[counts==1]
df[match(extract,df$data_values),]