Drucken Sie Zeilen in einer Datei, die mit Mustern in einer anderen Datei übereinstimmen
Ich habe eine Datei mit mehr als 40.000 Zeilen (Datei1) und möchte die Zeilen extrahieren, die mit den Mustern in Datei2 übereinstimmen (ungefähr 6000 Zeilen). Ich benutze grep so, aber es ist sehr langsam:grep -f file2 file1 > out
Gibt es einen schnelleren Weg, dies zu tun?awk
odersed
?
Hier sind einige Auszüge aus meinen Dateien:
File1:
scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG
scitn007747.1| scign007747 CACGCAGACGCAGTGGAGCATTCCAGGTCACAA
scitn003155.1| scign003155 TAAAAATCGTTAGCACTCGCTTGGTACACTAAC
scitn018252.1| scign018252 CGTGTGTGTGCATATGTGTGCATGCGTG
scitn004671.2| scign004671 TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT
File2:
scign000003
scign000004
scign000005
scign004671
scign000013
`