Вызов to_csv панд предшествует запятой
У меня есть файл данных яблок.csv, который имеет заголовки, такие как:
"id","str1","str2","str3","num1","num2"
Я прочитал это в dataframe с пандами:
apples = pd.read_csv('apples.csv',delimiter=",",sep=r"\s+")
Затем я делаю что-то с этим, но игнорирую это (у меня все это закомментировано, и мои общие проблемы все еще возникают, поэтому упомянутые вещи здесь неактуальны).
Затем я сохраняю это:
apples.to_csv('bananas.csv',columns=["id","str1","str2","str3","num1","num2"])
Теперь, глядя на bananas.csv, его заголовки:
,id,str1,str2,str3,num1,num2
Нет больше кавычек (которые меня не особо волнуют, так как они ничего не влияют на файл), а затем запятая. Последующие строки теперь содержат дополнительный столбец, поэтому он сохраняет 7 столбцов. Но если я сделаю:
print(len(apples.columns))
Непосредственно перед сохранением отображается 6 столбцов ...
Обычно я нахожусь в Java / Perl / R и менее опытен с Python и особенно с Pandas, поэтому я не уверен, что это «да, это просто так» или в чем проблема - но я потратил забавно долго пытаясь понять это и не может найти его с помощью поиска.
Как я могу заставить это не делать это предваряющий запятую, и возможно столь же важное - почему это делает это?