conte as ocorrências de valor na coluna 1 para cada sequência na coluna 2 usando awk
Eu tenho um arquivo grande com 7 colunas, gostaria de comparar 2 colunas, col 1 e col 7
chr_locations(col 1) gene_name(col 7)
chr1:66997989-67000678 geneA
chr1:66997824-67000456 geneA
chr2:33544389-33548489 geneB
chr2:33546285-33547055 geneB
chr2:44567890-44568980 geneB
Gostaria de contar as ocorrências de locais cromossômicos para um determinado gene:
chr1:66997989-67000678 geneA 2
chr1:66997824-67000456 geneA 2
chr2:33544389-33548489 geneB 3
chr2:33546285-33547055 geneB 3
chr2:44567890-44568980 geneB 3
Estou certo de que existe uma maneira mais fácil de fazer isso no awk do que escrever um script em python, algum de vocês pode ajudar? Obrigado.