zählen Sie das Vorkommen von value in Spalte 1 für jede Zeichenfolge in Spalte 2 mit awk
Ich habe eine große Datei mit 7 Spalten. Ich möchte 2 Spalten, Spalte 1 und Spalte 7, vergleichen.
chr_locations(col 1) gene_name(col 7)
chr1:66997989-67000678 geneA
chr1:66997824-67000456 geneA
chr2:33544389-33548489 geneB
chr2:33546285-33547055 geneB
chr2:44567890-44568980 geneB
Ich möchte das Vorkommen von Chromosomenstellen für ein bestimmtes Gen zählen:
chr1:66997989-67000678 geneA 2
chr1:66997824-67000456 geneA 2
chr2:33544389-33548489 geneB 3
chr2:33546285-33547055 geneB 3
chr2:44567890-44568980 geneB 3
Ich bin sicher, es gibt einen einfacheren Weg, dies in awk zu tun, als ein Skript in Python zu schreiben. Kann jemand von euch helfen? Vielen Dank