Pandy Pythona - ogranicznik końcowy myli read_csv

Question

Dec 05, 2012, 10:29 AM

Pandy Pythona - ogranicznik końcowy myli read_csv

Śledzę przykłady z książkiPython do analizy danych. Konkretnie, Baza danych wyborów z 2012 r. Z rozdziału 9. Dane są w dużym pliku csv, oddzielone przecinkiem. Ale każda linia pliku ma dodatkowy ogranicznik końcowy, który wydaje się mylićpandas.read_csv.

Traktuje dodatkowy ogranicznik tak, jakby istniała dodatkowa kolumna. Jest więc jeszcze jedna kolumna niż wymagane przez nagłówki. Następniepandas.read_csv pobiera pierwszą kolumnę jako etykiety wierszy. Ogólny efekt jest taki, że kolumny i nagłówki nie są już wyrównane - pierwsza kolumna staje się etykietami wierszy, druga kolumna jest nazywana pierwszym nagłówkiem itd.

To dość denerwujące. Jakiś pomysł, jak to powiedziećpandas.read_csv robić co należy? Nie mogłem znaleźć.

Świetna książka, BTW.