Как сделать разделитель в пандах read_csv более гибким в отношении пробелов?
Мне нужно создать фрейм данных, используя данные, хранящиеся в файле. Для этого я хочу использоватьread_csv
метод. Однако разделитель не очень регулярный. Некоторые столбцы разделены вкладками (\t
), другие разделены пробелами. Кроме того, некоторые столбцы могут быть разделены 2 или 3 или более пробелами или даже комбинацией пробелов и табуляций (например, 3 пробела, две табуляции и затем 1 пробел).
Есть ли способ заставить панд обращаться с этими файлами должным образом?
Кстати, у меня нет этой проблемы, если я использую Python. Я использую:
for line in file(file_name):
fld = line.split()
И это работает отлично. Не имеет значения, есть ли 2 или 3 пробела между полями. Даже комбинации пробелов и табуляции не вызывают никаких проблем. Могут ли панды делать то же самое?