Resultados da pesquisa a pedido "bioinformatics"

6 a resposta

Encontrando sobreposição em intervalos com R

Eu tenho dois data.frames, cada um com três colunas: chrom, start & stop, vamos chamá-los de rangesA e rangesB. Para cada linha de intervalosA, estou procurando descobrir qual (se houver) linha em intervalosB contém totalmente a linha ...

1 a resposta

Como posso converter o Ensembl ID em um símbolo genético em R?

Eu tenho um data.frame contendo Ensembl IDs em uma coluna; Gostaria de encontrar símbolos genéticos correspondentes para os valores dessa coluna e adicioná-los a uma nova coluna no meu quadro de dados. Usei o bioMaRt, mas ele não ...

5 a resposta

Gerando sequência de DNA sintético com taxa de substituição

Dada estas entradas: my $init_seq = "AAAAAAAAAA" #length 10 bp my $sub_rate = 0.003; my $nof_tags = 1000; my @dna = qw( A C G T );Quero gerar: Um mil tags de comprimento-10 A taxa de substituição para cada posição em uma tag é 0,003 ...

2 a resposta

Crie um "índice" para cada elemento de um grupo com data.table

Meus dados são agrupados pelos IDs na V6 e ordenados por posição (V1: V3): dt V1 V2 V3 V4 V5 V6 1: chr1 3054233 3054733 . + ENSMUSG00000090025 2: chr1 3102016 3102125 . + ENSMUSG00000064842 3: chr1 3205901 3207317 . - ENSMUSG00000051951 4: chr1 ...

2 a resposta

xiste uma função que pode calcular uma pontuação para seqüências alinhadas, considerando os parâmetros de alinhament

Tento pontuar as seqüências já alinhadas. Deixe dize seq1 = 'PAVKDLGAEG-ASDKGT--SHVVY----------TI-QLASTFE' seq2 = 'PAVEDLGATG-ANDKGT--LYNIYARNTEGHPRSTV-QLGSTFE' com os parâmetros fornecidos substitution matrix : blosum62 gap open penalty : -5 ...

2 a resposta

Organizando a saída do meu script de shell em tabelas dentro do arquivo de texto

Estou trabalhando com um script de shell unix que faz a construção do genoma e cria uma filogenia. Dependendo do montador de genoma usado, o resultado final (a filogenia) pode mudar. Desejo comparar os efeitos do uso de vários montadores ...

5 a resposta

Algorithm help! Algoritmo rápido na busca de uma string com seu parceiro

Estou procurando um algoritmo rápido para fins de pesquisa em uma cadeia enorme (é uma sequência do genoma do organismo composta de centenas de milhões a bilhões de caracteres Existem apenas 4 caracteres {A, C, G, T} presentes nessa string, e ...

6 a resposta

Como traçar um gráfico genético para uma sequência de DNA, digamos ATGCCGCTGCGC?

Preciso gerar uma caminhada aleatória com base na sequência de DNA de um vírus, dada a sequência de pares de bases de 2k pares de bases. A sequência se parece com "ATGCGTCGTAACGT". O caminho deve virar à direita para um A, à esquerda para um T, ...

5 a resposta

Como chamar o módulo escrito com argparse no notebook iPython

Estou tentando passar sequências de BioPython paraImplementação de Ilya Stepanov do algoritmo de árvore de sufixos de Ukkonen [https://gist.github.com/istepanov/6506508#file-lcs-py]no ambiente de notebook do iPython. Estou tropeçando no ...

1 a resposta

Média de execução R para dados não horários

Este é o enredo que estou tendo agora. É gerado a partir deste código: ggplot(data1, aes(x=POS,y=DIFF,colour=GT)) + geom_point() + facet_grid(~ CHROM,scales="free_x",space="free_x") + theme(strip.text.x = element_text(size=40), strip.background ...