Уникальные строки с несколькими запятыми в R [дубликаты]
На этот вопрос уже есть ответ:
Collapse / concatenate / объединить столбец в одну строку через запятую в каждой группе 2 ответаBackground: я нахожусь в процессе аннотирования SNP из GWAS в организме без особой аннотации. Я использую сцепленную таблицу tBLASTn из UCSC вместе с biomaRt для сопоставления каждого SNP с вероятным геном (ами).
У меня есть датафрейм, который выглядит следующим образом:
SNP hu_mRNA gene
chr1.111642529 NM_002107 H3F3A
chr1.111642529 NM_005324 H3F3B
chr1.111801684 BC098118 <NA>
chr1.111925084 NM_020435 GJC2
chr1.11801605 AK027740 <NA>
chr1.11801605 NM_032849 C13orf33
chr1.151220354 NM_018913 PCDHGA10
chr1.151220354 NM_018918 PCDHGA5
То, что я хотел бы закончить, - это одна строка для каждого SNP и разделение запятыми генов и hu_mRNAs. Вот то, что я после:
SNP hu_mRNA gene
chr1.111642529 NM_002107,NM_005324 H3F3A
chr1.111801684 BC098118,NM_020435 GJC2
chr1.11801605 AK027740,NM_032849 C13orf33
chr1.151220354 NM_018913,NM_018918 PCDHGA10,PCDHGA5
Теперь я знаю, что могу сделать это одним движением руки в Perl, но я действительно хочу сделать все это в R. Есть предложения?