cadeia python uma lista de um arquivo tsv
Eu tenho esse arquivo tsv contendo alguns caminhos de links, cada link é separado por um ';' Eu quero usar:
No exemplo abaixo, podemos ver que o texto no arquivo é separado e eu só quero ler a última coluna que é um caminho que começa com '14th'
6a3701d319fc3754 1297740409 166 14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade NULL
3824310e536af032 1344753412 88 14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade 3
415612e93584d30e 1349298640 138 14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade
Eu quero de alguma forma dividir o caminho em uma cadeia como esta:
['14th_century', 'Niger', 'Nigeria'....]
como faço para ler o arquivo e remover as 3 primeiras colunas para obter a última?
ATUALIZAR:
Eu tentei isso agora:
import re
with open('test.tsv') as f:
lines = f.readlines()
for line in lines[22:len(lines)]:
re.sub(r"^\s+", " ", line, flags = re.MULTILINE)
e_line = line.split(' ')
real_line = e_line[0]
print real_line.split(';')
Mas o problema é que ele não exclui as três primeiras colunas?