Resultados da pesquisa a pedido "bioinformatics"
todas as conclusões possíveis de forma de palavra do radical de uma palavra (biomédica)
Estou familiarizado com a derivação de palavras e a conclusão do pacote tm em R. Estou tentando criar um método rápido e sujo para encontrar todas as variantes de uma determinada palavra (dentro de um corpus). Por exemplo, eu gostaria de obter ...
Crie um "índice" para cada elemento de um grupo com data.table
Meus dados são agrupados pelos IDs na V6 e ordenados por posição (V1: V3): dt V1 V2 V3 V4 V5 V6 1: chr1 3054233 3054733 . + ENSMUSG00000090025 2: chr1 3102016 3102125 . + ENSMUSG00000064842 3: chr1 3205901 3207317 . - ENSMUSG00000051951 4: chr1 ...
Bash: substituir parte do nome do arquivo
Eu tenho um comando que quero executar em todos os arquivos de uma pasta, e a sintaxe do comando é semelhante a esta: tophat -o <output_file> <input_file>O que eu gostaria de fazer é um script que faça um loop em todos os arquivos em uma pasta ...
AWK: extrair linhas se a coluna no arquivo 1 estiver dentro de um intervalo declarado em duas colunas em outro arquivo
Atualmente, estou tendo um problema com o AWK que ainda não consegui resolver. Eu tenho um arquivo enorme (30 GB) com dados genômicos que contém uma lista com posições (declaradas nas colunas 1 e 2) e uma segunda lista que contém ...
Organizando a saída do meu script de shell em tabelas dentro do arquivo de texto
Estou trabalhando com um script de shell unix que faz a construção do genoma e cria uma filogenia. Dependendo do montador de genoma usado, o resultado final (a filogenia) pode mudar. Desejo comparar os efeitos do uso de vários montadores ...
xiste uma função que pode calcular uma pontuação para seqüências alinhadas, considerando os parâmetros de alinhament
Tento pontuar as seqüências já alinhadas. Deixe dize seq1 = 'PAVKDLGAEG-ASDKGT--SHVVY----------TI-QLASTFE' seq2 = 'PAVEDLGATG-ANDKGT--LYNIYARNTEGHPRSTV-QLGSTFE' com os parâmetros fornecidos substitution matrix : blosum62 gap open penalty : -5 ...
Consultando os registros do serviço DNS para encontrar o nome do host e o TCP / IP
Em um artigo sobre oLife Science Identifiers (VejoLSID Tester, uma ferramenta para testar os serviços de resolução do Life Science Identifier [http://www.scfbm.org/content/3/1/2]), Escreveu o Dr. Roderic DM Page: Dado o LSID urn: lsid **: ...
estilo @Dictionary substitui vários itens
Tenho um data.frame grande de dados de caracteres que desejo converter com base no que é comumente chamado de dicionário em outros idioma Atualmente, eu estou fazendo isso assim: foo <- data.frame(snp1 = c("AA", "AG", "AA", "AA"), snp2 = ...
Repetição repetida mais longa (k vezes)
Eu sei que este é um tópico um pouco batido, mas eu alcancei o limite de ajuda que posso obter do que já foi respondido.Isto é para oProblema do projeto Rosa...
Converter csv em árvore Newick
Portanto, eu tenho um arquivo csv em que cada linha representa dados hierárquicos na forma: 'Phylum', 'Class', 'Order', 'Family', 'Genus', 'Species', 'Subpecies', 'unique_gi' Eu gostaria de converter isso no clássicoFormato de árvore ...