Umwandlung von .DAT im gemischten Format in .CSV (oder etwas anderem)
Ich habe eine große Sammlung von DAT-Dateien, die konvertiert werden müssen (eventuell in einen eindeutigen Dateityp). Die DATs haben eine gemischte Menge an Leerzeichen zwischen den Feldern, und die Spaltenüberschriften befinden sich in verschiedenen Zeilen. Irgendein Rat
ALT_RAD
ALT_RAD2
DIRECT D_GLOBAL U_GLOBAL Zenith
Year Mn Dy Hr Mi DIFFUSE2 D_IR U_IR
2004 9 1 0 1 1.04 79.40 78.67 303.58 61.06 310.95 85.142
2004 9 1 0 2 0.71 74.36 73.91 303.80 57.82 310.92 85.171
2004 9 1 0 3 0.67 71.80 71.64 304.25 56.84 310.98 85.199
2004 9 1 0 4 0.75 74.35 74.83 304.21 59.68 310.89 85.227
Ich habe ein einfaches Skript:
import sys
with open(sys.argv[1], r) as input_file:
newLines = []
for line in input_file:
newLines.append(newLine)
Welche ich sicherlich ändern werde, um gemischte Leerzeichen zu berücksichtigen, aber ich weiß nicht, wie ich mit den wackeligen Spaltenüberschriften arbeiten soll.
Eventually Ich möchte, dass meine Überschriften einfach sind:
Year Month Day Hour Minute Direct Diffuse2 D_Global D_IR U_Global U_IR Zenith