Resultados da pesquisa a pedido "bioinformatics"
Encontrando sobreposição em intervalos com R
Eu tenho dois data.frames, cada um com três colunas: chrom, start & stop, vamos chamá-los de rangesA e rangesB. Para cada linha de intervalosA, estou procurando descobrir qual (se houver) linha em intervalosB contém totalmente a linha ...
Como posso converter o Ensembl ID em um símbolo genético em R?
Eu tenho um data.frame contendo Ensembl IDs em uma coluna; Gostaria de encontrar símbolos genéticos correspondentes para os valores dessa coluna e adicioná-los a uma nova coluna no meu quadro de dados. Usei o bioMaRt, mas ele não ...
Gerando sequência de DNA sintético com taxa de substituição
Dada estas entradas: my $init_seq = "AAAAAAAAAA" #length 10 bp my $sub_rate = 0.003; my $nof_tags = 1000; my @dna = qw( A C G T );Quero gerar: Um mil tags de comprimento-10 A taxa de substituição para cada posição em uma tag é 0,003 ...
Crie um "índice" para cada elemento de um grupo com data.table
Meus dados são agrupados pelos IDs na V6 e ordenados por posição (V1: V3): dt V1 V2 V3 V4 V5 V6 1: chr1 3054233 3054733 . + ENSMUSG00000090025 2: chr1 3102016 3102125 . + ENSMUSG00000064842 3: chr1 3205901 3207317 . - ENSMUSG00000051951 4: chr1 ...
xiste uma função que pode calcular uma pontuação para seqüências alinhadas, considerando os parâmetros de alinhament
Tento pontuar as seqüências já alinhadas. Deixe dize seq1 = 'PAVKDLGAEG-ASDKGT--SHVVY----------TI-QLASTFE' seq2 = 'PAVEDLGATG-ANDKGT--LYNIYARNTEGHPRSTV-QLGSTFE' com os parâmetros fornecidos substitution matrix : blosum62 gap open penalty : -5 ...
Organizando a saída do meu script de shell em tabelas dentro do arquivo de texto
Estou trabalhando com um script de shell unix que faz a construção do genoma e cria uma filogenia. Dependendo do montador de genoma usado, o resultado final (a filogenia) pode mudar. Desejo comparar os efeitos do uso de vários montadores ...
Algorithm help! Algoritmo rápido na busca de uma string com seu parceiro
Estou procurando um algoritmo rápido para fins de pesquisa em uma cadeia enorme (é uma sequência do genoma do organismo composta de centenas de milhões a bilhões de caracteres Existem apenas 4 caracteres {A, C, G, T} presentes nessa string, e ...
Como traçar um gráfico genético para uma sequência de DNA, digamos ATGCCGCTGCGC?
Preciso gerar uma caminhada aleatória com base na sequência de DNA de um vírus, dada a sequência de pares de bases de 2k pares de bases. A sequência se parece com "ATGCGTCGTAACGT". O caminho deve virar à direita para um A, à esquerda para um T, ...
Como chamar o módulo escrito com argparse no notebook iPython
Estou tentando passar sequências de BioPython paraImplementação de Ilya Stepanov do algoritmo de árvore de sufixos de Ukkonen [https://gist.github.com/istepanov/6506508#file-lcs-py]no ambiente de notebook do iPython. Estou tropeçando no ...
Média de execução R para dados não horários
Este é o enredo que estou tendo agora. É gerado a partir deste código: ggplot(data1, aes(x=POS,y=DIFF,colour=GT)) + geom_point() + facet_grid(~ CHROM,scales="free_x",space="free_x") + theme(strip.text.x = element_text(size=40), strip.background ...