Wybieranie wierszy, w których kolumna ma ciąg znaków, np. „Hsa ..” (częściowe dopasowanie ciągu)

Question

Oct 24, 2012, 08:25 AM

Wybieranie wierszy, w których kolumna ma ciąg znaków, np. „Hsa ..” (częściowe dopasowanie ciągu)

Mam plik tekstowy o rozmiarze 371 MB zawierający dane mikro RNA. Zasadniczo chciałbym wybrać tylko te wiersze, które zawierają informacje o ludzkim mikroRNA.

Przeczytałem plik używając tabeli read.table. Zazwyczaj osiągałbym to, co chciałbym z sqldf - gdyby miał składnię „podobną” (wybierz * z <> gdzie miRNA jak „hsa”). Niestety - sqldf nie obsługuje tej składni.

Jak mogę to zrobić w R? Rozejrzałem się wokół stackoverflow i nie widzę przykładujak mogę wykonać częściowe dopasowanie ciągów. Zainstalowałem nawet pakiet stringr - ale nie ma tego, czego potrzebuję.

To, co chciałbym zrobić, to coś w tym stylu - gdzie wszystkie rzędy, w których znajduje się hsa-* są wybrane.

selectedRows <- conservedData[, conservedData$miRNA %like% "hsa-"]

co oczywiście nie jest poprawną składnią.

Czy ktoś może mi z tym pomóc? Wielkie dzięki za czytanie.

Asda

questionAnswers(3)

Popularne pytania

0 odpowiedzi

Jak zbudować pakiet Debian / Ubuntu ze źródła?

0 odpowiedzi

Niezgodne typy - czy to dlatego, że tablica jest już wskaźnikiem?

0 odpowiedzi

C porównywanie znaku z ostrzeżeniem „n”: porównanie wskaźnika i liczby całkowitej

0 odpowiedzi

Jak wywołać synchronizację $ http z AngularJS

0 odpowiedzi

Działający przykład lub działająca wersja demonstracyjna interfejsu w JavaScript

Jesteś bardzo aktywny! To świetnie!

Wybieranie wierszy, w których kolumna ma ciąg znaków, np. „Hsa ..” (częściowe dopasowanie ciągu)

questionAnswers(3)

yourAnswerToTheQuestion

Popularne pytania