Como fazer separador em pandas read_csv mais flexivel writ whitespace?
Eu preciso criar um quadro de dados usando dados armazenados em um arquivo. Para isso eu quero usarread_csv
método. No entanto, o separador não é muito regular. Algumas colunas são separadas por tabulações (\t
), outros são separados por espaços. Além disso, algumas colunas podem ser separadas por 2 ou 3 ou mais espaços ou até mesmo por uma combinação de espaços e guias (por exemplo, 3 espaços, duas guias e, em seguida, um espaço).
Existe uma maneira de dizer aos pandas para tratar esses arquivos corretamente?
By the way, eu não tenho esse problema se eu usar o Python. Eu uso:
for line in file(file_name):
fld = line.split()
E isso funciona perfeito. Não importa se há 2 ou 3 espaços entre os campos. Mesmo combinações de espaços e tabulações não causam nenhum problema. Os pandas podem fazer o mesmo?