Tipps zum Einlesen einer komplexen Datei - Python
Ich habe komplexe, variable Textdateien, die ich in Python einlesen möchte, aber ich bin mir nicht sicher, welche Strategie die beste wäre. Ich suche nicht, dass Sie irgendetwas für mich codieren, nur ein paar Tipps, welche Module am besten zu meinen Bedürfnissen / Tipps passen usw.
Die Dateien sehen ungefähr so aus:
Program
Username: X Laser: X Em: X
exp 1
sample 1
Time: X Notes: X
Read 1 X data
Read 2 X data
# unknown number of reads
sample 2
Time: X Notes: X
Read 1 X data
...
# Unknown number of samples
exp 2
sample 1
...
# Unknown number of experiments, samples and reads
# The 4 spaces between certain words represent tabs
Um diese Daten zu analysieren, muss ich die Daten für jeden Messwert abrufen und wissen, von welcher Probe und von welchem Experiment sie stammten. Ich kann auch das Ausgabedateiformat ändern, denke aber, dass die Art und Weise, wie ich es hier geschrieben habe, am einfachsten zu lesen ist.
Um diese Datei in Python einzulesen, ist es meines Erachtens am besten, sie zeilenweise einzulesen und mit regulären Ausdrücken nach Schlüsselwörtern zu suchen. Suchen Sie zum Beispiel in der Zeile nach dem Schlüsselwort "exp" und notieren Sie die Nummer danach. Suchen Sie dann in der nächsten Zeile nach sample und so weiter. Dies würde jedoch natürlich nicht funktionieren, wenn im Abschnitt "Notizen" ein Schlüsselwort verwendet würde.
Also, ich bin ein bisschen ratlos, was meinen Bedürfnissen am besten entspricht (es ist schwierig, etwas zu verwenden, wenn Sie nicht wissen, dass es existiert!)
Vielen Dank für Ihre Zeit