цепочка python список из файла tsv
У меня есть этот файл TSV, содержащий несколько путей ссылок, каждая ссылка отделена ';' я хочу использовать:
В приведенном ниже примере мы можем видеть, что текст в файле отделен, и я хочу только прочитать последний столбец, который является путем, начинающимся с «14-го»
6a3701d319fc3754 1297740409 166 14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade NULL
3824310e536af032 1344753412 88 14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade 3
415612e93584d30e 1349298640 138 14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade
Я хочу как-то разбить путь на цепочку, как это:
['14th_century', 'Niger', 'Nigeria'....]
Как я могу прочитать файл и удалить первые 3 столбца, чтобы я получил только последний?
ОБНОВИТЬ:
я попробовал это сейчас:
import re
with open('test.tsv') as f:
lines = f.readlines()
for line in lines[22:len(lines)]:
re.sub(r"^\s+", " ", line, flags = re.MULTILINE)
e_line = line.split(' ')
real_line = e_line[0]
print real_line.split(';')
Но проблема в том, что это не удаление первых 3 столбцов?