użycie awk do zaznaczenia linii w pliku A, na podstawie znalezienia dopasowań w pliku B
Mam dwa pliki, plik A wygląda tak:
1 101427 GENE|ACT-A 1 101589 GENE|ACT-B 0.0357
1 101427 GENE|ACT-A 1 101785 GENE|ACT-C 0.6357
1 101427 GENE|TAD-J 1 101437 GENE|TAD-L 0.8967
1 101427 GENE|TAD-J 1 158988 GENE|TAD-O 0.0067
1 101427 GENE|TAD-J 1 159999 GENE|TAD-V 0.5427
1 101427 GENE|POL-D 1 101437 GENE|POL-H 0.2347
a plik B wygląda tak:
GENE|ACT-A
GENE|TAD-L
GENE|POL-D
Chciałbym wybrać linie w pliku A, gdzie kolumna 3 lub kolumna 6 mają dopasowanie w pliku B. W powyższym przykładzie wynik będzie wyglądał następująco:
1 101427 GENE|ACT-A 1 101589 GENE|ACT-B 0.0357
1 101427 GENE|ACT-A 1 101785 GENE|ACT-C 0.6357
1 101427 GENE|TAD-J 1 101437 GENE|TAD-L 0.8967
1 101427 GENE|POL-D 1 101437 GENE|POL-H 0.2347
Czy można to osiągnąć po prostu przy pomocy awk.
Twoje zdrowie.