Уникальные строки с несколькими запятыми в R [дубликаты]

На этот вопрос уже есть ответ:

Collapse / concatenate / объединить столбец в одну строку через запятую в каждой группе 2 ответа

Background: я нахожусь в процессе аннотирования SNP из GWAS в организме без особой аннотации. Я использую сцепленную таблицу tBLASTn из UCSC вместе с biomaRt для сопоставления каждого SNP с вероятным геном (ами).

У меня есть датафрейм, который выглядит следующим образом:

            SNP   hu_mRNA     gene
 chr1.111642529 NM_002107    H3F3A
 chr1.111642529 NM_005324    H3F3B
 chr1.111801684 BC098118     <NA>
 chr1.111925084 NM_020435    GJC2
  chr1.11801605 AK027740     <NA>
  chr1.11801605 NM_032849    C13orf33
 chr1.151220354 NM_018913    PCDHGA10
 chr1.151220354 NM_018918    PCDHGA5

То, что я хотел бы закончить, - это одна строка для каждого SNP и разделение запятыми генов и hu_mRNAs. Вот то, что я после:

            SNP            hu_mRNA    gene
 chr1.111642529 NM_002107,NM_005324   H3F3A
 chr1.111801684  BC098118,NM_020435   GJC2
  chr1.11801605  AK027740,NM_032849   C13orf33
 chr1.151220354 NM_018913,NM_018918   PCDHGA10,PCDHGA5

Теперь я знаю, что могу сделать это одним движением руки в Perl, но я действительно хочу сделать все это в R. Есть предложения?

Ответы на вопрос(5)

Ваш ответ на вопрос