Pandy Pythona - ogranicznik końcowy myli read_csv
Śledzę przykłady z książkiPython do analizy danych. Konkretnie, Baza danych wyborów z 2012 r. Z rozdziału 9. Dane są w dużym pliku csv, oddzielone przecinkiem. Ale każda linia pliku ma dodatkowy ogranicznik końcowy, który wydaje się mylićpandas.read_csv
.
Traktuje dodatkowy ogranicznik tak, jakby istniała dodatkowa kolumna. Jest więc jeszcze jedna kolumna niż wymagane przez nagłówki. Następniepandas.read_csv
pobiera pierwszą kolumnę jako etykiety wierszy. Ogólny efekt jest taki, że kolumny i nagłówki nie są już wyrównane - pierwsza kolumna staje się etykietami wierszy, druga kolumna jest nazywana pierwszym nagłówkiem itd.
To dość denerwujące. Jakiś pomysł, jak to powiedziećpandas.read_csv
robić co należy? Nie mogłem znaleźć.
Świetna książka, BTW.