Python encadena una lista de un archivo tsv
Tengo este archivo tsv que contiene algunas rutas de enlaces, cada enlace está separado por un ';' Quiero usar:
En el siguiente ejemplo podemos ver que el texto en el archivo está separado y solo quiero leer la última columna, que es una ruta que comienza con '14'
6a3701d319fc3754 1297740409 166 14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade NULL
3824310e536af032 1344753412 88 14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade 3
415612e93584d30e 1349298640 138 14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade
Quiero dividir de alguna manera el camino en una cadena como esta:
['14th_century', 'Niger', 'Nigeria'....]
¿Cómo leo el archivo y elimino las primeras 3 columnas para que solo obtenga la última?
ACTUALIZAR:
He intentado esto ahora:
import re
with open('test.tsv') as f:
lines = f.readlines()
for line in lines[22:len(lines)]:
re.sub(r"^\s+", " ", line, flags = re.MULTILINE)
e_line = line.split(' ')
real_line = e_line[0]
print real_line.split(';')
¿Pero el problema es que no elimina las primeras 3 columnas?