zählen Sie das Vorkommen von value in Spalte 1 für jede Zeichenfolge in Spalte 2 mit awk

Ich habe eine große Datei mit 7 Spalten. Ich möchte 2 Spalten, Spalte 1 und Spalte 7, vergleichen.

 chr_locations(col 1)        gene_name(col 7)
chr1:66997989-67000678        geneA
chr1:66997824-67000456        geneA
chr2:33544389-33548489        geneB
chr2:33546285-33547055        geneB
chr2:44567890-44568980        geneB

Ich möchte das Vorkommen von Chromosomenstellen für ein bestimmtes Gen zählen:

chr1:66997989-67000678    geneA     2
chr1:66997824-67000456    geneA     2
chr2:33544389-33548489    geneB     3
chr2:33546285-33547055    geneB     3
chr2:44567890-44568980    geneB     3

Ich bin sicher, es gibt einen einfacheren Weg, dies in awk zu tun, als ein Skript in Python zu schreiben. Kann jemand von euch helfen? Vielen Dank

Antworten auf die Frage(4)

Ihre Antwort auf die Frage