conte as ocorrências de valor na coluna 1 para cada sequência na coluna 2 usando awk

Question

Sep 25, 2015, 10:23 PM

conte as ocorrências de valor na coluna 1 para cada sequência na coluna 2 usando awk

Eu tenho um arquivo grande com 7 colunas, gostaria de comparar 2 colunas, col 1 e col 7

 chr_locations(col 1)        gene_name(col 7)
chr1:66997989-67000678        geneA
chr1:66997824-67000456        geneA
chr2:33544389-33548489        geneB
chr2:33546285-33547055        geneB
chr2:44567890-44568980        geneB

Gostaria de contar as ocorrências de locais cromossômicos para um determinado gene:

chr1:66997989-67000678    geneA     2
chr1:66997824-67000456    geneA     2
chr2:33544389-33548489    geneB     3
chr2:33546285-33547055    geneB     3
chr2:44567890-44568980    geneB     3

Estou certo de que existe uma maneira mais fácil de fazer isso no awk do que escrever um script em python, algum de vocês pode ajudar? Obrigado.