Использование файла .fasta для вычисления относительного содержания последовательностей
Так что я, будучи «нубом», совсем недавно познакомился с программированием через Perl, я все еще привыкаю ко всему этому. У меня есть файл .fasta, который я должен использовать, хотя я не уверен, смогу ли я его открыть или, если можно так сказать, работать с ним «вслепую».
В любом случае, файл, который у меня есть, содержит последовательности ДНК для трех генов, написанные в этом формате .fasta.
Видимо это что-то вроде этого:
>label
sequence
>label
sequence
>label
sequence
Моя цель - написать скрипт, который откроет и прочитает файл, который я уже освоил, но я должен прочитать каждую последовательность, вычислить относительные значения «G» и «C» в каждой последовательности, а затем я m записать его в TAB-файл с разделителями - имена генов и их содержание «G» и «C».
Кто-нибудь сможет дать какое-то руководство? Я не уверен, что такое файл с разделителями TAB, и я все еще пытаюсь выяснить, как открыть файл .fasta, чтобы увидеть содержимое. До сих пор я работал с файлами .txt, которые я могу легко открыть, но не .fasta.
Я прошу прощения за звучание совершенно сбитым с толку. Буду признателен за ваше терпение. Я не такой, как вы, профессионалы!