R - найти все уникальные значения среди подмножеств фрейма данных

Question

Jun 04, 2012, 12:15 AM

R - найти все уникальные значения среди подмножеств фрейма данных

У меня есть фрейм данных с двумя столбцами. Первый столбец определяет подмножества данных. Я хочу найти все значения во втором столбце, которые появляются только в одном подмножестве в первом столбце.

Например, из:

df=data.frame(
  data_subsets=rep(LETTERS[1:2],each=5),
  data_values=c(1,2,3,4,5,2,3,4,6,7))

data_subsets data_values
      A           1
      A           2
      A           3
      A           4
      A           5
      B           2
      B           3
      B           4
      B           6
      B           7

Я хотел бы извлечь следующий кадр данных.

data_subsets   data_values
    A              1
    A              5
    B              6
    B              7

Я играл сduplicated но я просто не могу заставить его работать. Любая помощь приветствуется. Существует ряд тем, посвященных решению подобных проблем, надеюсь, я не упустил из виду ответ в моих поисках!

EDIT

Я изменил подход @Matthew Lundberg к подсчету количества элементов и извлечению из фрейма данных. По какой-то причине его подход не работал с фреймом данных, который у меня был, поэтому я придумал это, что не так элегантно, но выполняет свою работу:

counts=rowSums(do.call("rbind",tapply(df$data_subsets,df$data_values,FUN=table)))
extract=names(counts)[counts==1]
df[match(extract,df$data_values),]

R - найти все уникальные значения среди подмножеств фрейма данных

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

R - найти все уникальные значения среди подмножеств фрейма данных

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы