Passen Sie die Werte in der ersten Spalte von zwei Dateien an und fügen Sie die übereinstimmenden Zeilen in einer neuen Datei zusammen
Ich muss Übereinstimmungen mit der Zeichenfolge in Spalte 1 ($ 1) in Datei1.txt mit der Zeichenfolge in Spalte 1 ($ 1) in Datei2.txt finden. Dann möchte ich die Zeilen verbinden, in denen es eine Übereinstimmung in einer neuen Datei gab.
cat file1.txt
1050008 5.156725968 8.404038296 124.9198605 3.23E-21 2.33E-17 38.57865782
3310747 5.631470026 8.581936875 124.6039122 3.34E-21 2.33E-17 38.55204806
5910451 4.900364671 8.455329195 124.5720603 3.35E-21 2.33E-17 38.54935989
730156 5.565210738 8.48792701 122.2168789 4.28E-21 2.33E-17 38.34773989
cat file2.txt
4230037 ILMN Controls ILMN_Controls ERCC-00071 ILMN_333646 ERCC-00071 ERCC-00071
1050008 ILMN Controls ILMN_Controls ERCC-00009 ILMN_333584 ERCC-00009 ERCC-00009
5260356 ILMN Controls ILMN_Controls ERCC-00053 ILMN_333628 ERCC-00053 ERCC-00053
3310747 ILMN Controls ILMN_Controls ERCC-00144 ILMN_333719 ERCC-00144 ERCC-00144
5910451 ILMN Controls ILMN_Controls ERCC-00003 ILMN_333578 ERCC-00003 ERCC-00003
1710435 ILMN Controls ILMN_Controls ERCC-00138 ILMN_333713 ERCC-00138 ERCC-00138
1400612 ILMN Controls ILMN_Controls ERCC-00084 ILMN_333659 ERCC-00084 ERCC-00084
730156 ILMN Controls ILMN_Controls ERCC-00017 ILMN_333592 ERCC-00017 ERCC-00017
Ich möchte, dass die Ausgabedatei so aussieht:
out.txt
1050008 5.156725968 8.404038296 124.9198605 3.23E-21 2.33E-17 38.57865782 1050008 ILMN Controls ILMN_Controls ERCC-00009 ILMN_333584 ERCC-00009 ERCC-00009
3310747 5.631470026 8.581936875 124.6039122 3.34E-21 2.33E-17 38.55204806 3310747 ILMN Controls ILMN_Controls ERCC-00144 ILMN_333719 ERCC-00144 ERCC-00144
5910451 4.900364671 8.455329195 124.5720603 3.35E-21 2.33E-17 38.54935989 5910451 ILMN Controls ILMN_Controls ERCC-00003 ILMN_333578 ERCC-00003 ERCC-00003
730156 5.565210738 8.48792701 122.2168789 4.28E-21 2.33E-17 38.34773989 730156 ILMN Controls ILMN_Controls ERCC-00017 ILMN_333592 ERCC-00017 ERCC-00017
Die Dateien sind durch Tabulatoren getrennt und haben in einigen Spalten fehlende Werte.
Es gibt 31 Spalten in file2.txt und> 47000 Zeilen und ich versuche dies in bash (OSX) zu tun
Wenn Sie eine Lösung haben, würde ich mich sehr freuen, wenn Sie die Schritte kurz erläutern könnten, da ich sehr neu in diesem Bereich bin.