python verkette eine liste aus einer tsv datei
Ich habe diese TSV-Datei mit einigen Pfaden von Links. Jeder Link ist durch ein ';' Ich möchte benutzen:
In dem Beispiel unten können wir sehen, dass der Text in der Datei getrennt ist und ich nur die letzte Spalte durchlesen möchte, die ein Pfad ist, der mit '14th' beginnt.
6a3701d319fc3754 1297740409 166 14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade NULL
3824310e536af032 1344753412 88 14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade 3
415612e93584d30e 1349298640 138 14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade
Ich möchte den Pfad irgendwie in eine Kette wie diese aufteilen:
['14th_century', 'Niger', 'Nigeria'....]
Wie lese ich die Datei und entferne die ersten 3 Spalten, damit ich nur die letzte bekomme?
AKTUALISIEREN:
Ich habe das jetzt versucht:
import re
with open('test.tsv') as f:
lines = f.readlines()
for line in lines[22:len(lines)]:
re.sub(r"^\s+", " ", line, flags = re.MULTILINE)
e_line = line.split(' ')
real_line = e_line[0]
print real_line.split(';')
Aber das Problem ist, dass es nicht die ersten 3 Spalten löscht?