Przygotuj ramkę danych pand zawierającą NaNs

Question

Nov 28, 2012, 11:43 AM

Przygotuj ramkę danych pand zawierającą NaNs

Mam dane GPS prędkości lodu z trzech różnych odbiorników GPS. Dane znajdują się w ramce danych pand z indeksem julian day (przyrostowym od początku 2009 r.).

Jest to podzbiór danych (główny zestaw danych to 3487235 wierszy ...):

                    R2          R7         R8
1235.000000 116.321959  100.805197  96.519977
1235.000116 NaN         100.771133  96.234957
1235.000231 NaN         100.584559  97.249262
1235.000347 118.823610  100.169055  96.777833
1235.000463 NaN         99.753551   96.598350
1235.000579 NaN         99.338048   95.283989
1235.000694 113.995003  98.922544   95.154067

Ramka danych ma postać:

Index: 6071320 entries, 127.67291667 to 1338.51805556
Data columns:
R2    3487235  non-null values
R7    3875864  non-null values
R8    1092430  non-null values
dtypes: float64(3)

R2 próbkował z różną szybkością do R7 i R8, stąd NaNs, które pojawiają się systematycznie w tym odstępie.

Próbowaćdf.plot() Aby narysować całą ramkę danych (lub jej indeksowane lokalizacje wierszy) działa dobrze pod względem drukowania R7 i R8, ale nie wykreśla R2. Podobnie po prostu robiędf.R2.plot() także nie działa. Jedynym sposobem na wykreślenie R2 jest zrobieniedf.R2.dropna().plot(), ale to również usuwa NaNs, które oznaczają okresy braku danych (a nie tylko grubszą częstotliwość próbkowania niż inne odbiorniki).

Czy ktoś inny to zetknął? Wszelkie pomysły dotyczące tego problemu zostaną z wdzięcznością przyjęte :)