Wie extrahiere ich bestimmte Spalten aus einer durch Leerzeichen getrennten Datei in Python?

Ich versuche, eine Datei aus der Proteindatenbank zu verarbeiten, die durch Leerzeichen (nicht \ t) getrennt ist. Ich habe eine TXT-Datei und möchte bestimmte Zeilen extrahieren. Aus diesen Zeilen möchte ich nur einige Spalten extrahieren.

Ich muss es in Python machen. Ich habe es zuerst mit der Befehlszeile versucht und den Befehl awk ohne Probleme verwendet, aber ich habe keine Ahnung, wie ich dasselbe in Python tun soll.

Hier ist ein Auszug aus meiner Datei:

[...]
SEQRES   6 B   80  ALA LEU SER ILE LYS LYS ALA GLN THR PRO GLN GLN TRP          
SEQRES   7 B   80  LYS PRO                                                      
HELIX    1   1 THR A   68  SER A   81  1                                  14    
HELIX    2   2 CYS A   97  LEU A  110  1                                  14    
HELIX    3   3 ASN A  122  SER A  133  1                                  12    
[...]

Zum Beispiel möchte ich nur die 'HELIX'-Zeilen und dann die 4., 6., 7. und 9. Spalte nehmen. Ich fing an, die Datei Zeile für Zeile mit einer for-Schleife zu lesen und extrahierte dann die Zeilen, die mit 'HELIX' beginnen ... und das ist alles.

EDIT: Dies ist der Code, den ich gerade habe, aber der Druck funktioniert nicht richtig, nur die erste Zeile jedes Blocks wird gedruckt (HELIX SHEET AND DBREF)

#!/usr/bin/python
import sys

for line in open(sys.argv[1]):
 if 'HELIX' in line:
   helix = line.split()
 elif 'SHEET'in line:
   sheet = line.split()
 elif 'DBREF' in line:
   dbref = line.split()

print (helix), (sheet), (dbref)

Antworten auf die Frage(4)

Ihre Antwort auf die Frage