Resultados da pesquisa a pedido "bioinformatics"
Crie um "índice" para cada elemento de um grupo com data.table
Meus dados são agrupados pelos IDs na V6 e ordenados por posição (V1: V3): dt V1 V2 V3 V4 V5 V6 1: chr1 3054233 3054733 . + ENSMUSG00000090025 2: chr1 3102016 3102125 . + ENSMUSG00000064842 3: chr1 3205901 3207317 . - ENSMUSG00000051951 4: chr1 ...
AWK: extrair linhas se a coluna no arquivo 1 estiver dentro de um intervalo declarado em duas colunas em outro arquivo
Atualmente, estou tendo um problema com o AWK que ainda não consegui resolver. Eu tenho um arquivo enorme (30 GB) com dados genômicos que contém uma lista com posições (declaradas nas colunas 1 e 2) e uma segunda lista que contém ...
Mesclar faixas numéricas sobrepostas em faixas contínuas
Estou tentando mesclar um intervalo de coordenadas genômicas em intervalos contínuos, com uma opção adicional para mesclar lacunas. Por exemplo, se eu tivesse os intervalos genômicos[[0, 1000], [5, 1100]] Eu gostaria que o resultado fosse[0, ...
Bash: substituir parte do nome do arquivo
Eu tenho um comando que quero executar em todos os arquivos de uma pasta, e a sintaxe do comando é semelhante a esta: tophat -o <output_file> <input_file>O que eu gostaria de fazer é um script que faça um loop em todos os arquivos em uma pasta ...
Converter csv em árvore Newick
Portanto, eu tenho um arquivo csv em que cada linha representa dados hierárquicos na forma: 'Phylum', 'Class', 'Order', 'Family', 'Genus', 'Species', 'Subpecies', 'unique_gi' Eu gostaria de converter isso no clássicoFormato de árvore ...
Como posso converter o Ensembl ID em um símbolo genético em R?
Eu tenho um data.frame contendo Ensembl IDs em uma coluna; Gostaria de encontrar símbolos genéticos correspondentes para os valores dessa coluna e adicioná-los a uma nova coluna no meu quadro de dados. Usei o bioMaRt, mas ele não ...
Organizando a saída do meu script de shell em tabelas dentro do arquivo de texto
Estou trabalhando com um script de shell unix que faz a construção do genoma e cria uma filogenia. Dependendo do montador de genoma usado, o resultado final (a filogenia) pode mudar. Desejo comparar os efeitos do uso de vários montadores ...
Encontre regiões sobrepostas e extraia o respectivo valor
Como você encontra as coordenadas sobrepostas e extrai os respectivos valores seg.mean para a região sobreposta? data1 Rl pValue chr start end CNA 2 2.594433 6 129740000 129780000 gain 2 3.941399 6 130080000 130380000 gain 1 1.992114 10 80900000 ...
Como chamar o módulo escrito com argparse no notebook iPython
Estou tentando passar sequências de BioPython paraImplementação de Ilya Stepanov do algoritmo de árvore de sufixos de Ukkonen [https://gist.github.com/istepanov/6506508#file-lcs-py]no ambiente de notebook do iPython. Estou tropeçando no ...
todas as conclusões possíveis de forma de palavra do radical de uma palavra (biomédica)
Estou familiarizado com a derivação de palavras e a conclusão do pacote tm em R. Estou tentando criar um método rápido e sujo para encontrar todas as variantes de uma determinada palavra (dentro de um corpus). Por exemplo, eu gostaria de obter ...