Przygotuj ramkę danych pand zawierającą NaNs
Mam dane GPS prędkości lodu z trzech różnych odbiorników GPS. Dane znajdują się w ramce danych pand z indeksem julian day (przyrostowym od początku 2009 r.).
Jest to podzbiór danych (główny zestaw danych to 3487235 wierszy ...):
R2 R7 R8
1235.000000 116.321959 100.805197 96.519977
1235.000116 NaN 100.771133 96.234957
1235.000231 NaN 100.584559 97.249262
1235.000347 118.823610 100.169055 96.777833
1235.000463 NaN 99.753551 96.598350
1235.000579 NaN 99.338048 95.283989
1235.000694 113.995003 98.922544 95.154067
Ramka danych ma postać:
Index: 6071320 entries, 127.67291667 to 1338.51805556 Data columns: R2 3487235 non-null values R7 3875864 non-null values R8 1092430 non-null values dtypes: float64(3)
R2 próbkował z różną szybkością do R7 i R8, stąd NaNs, które pojawiają się systematycznie w tym odstępie.
Próbowaćdf.plot()
Aby narysować całą ramkę danych (lub jej indeksowane lokalizacje wierszy) działa dobrze pod względem drukowania R7 i R8, ale nie wykreśla R2. Podobnie po prostu robiędf.R2.plot()
także nie działa. Jedynym sposobem na wykreślenie R2 jest zrobieniedf.R2.dropna().plot()
, ale to również usuwa NaNs, które oznaczają okresy braku danych (a nie tylko grubszą częstotliwość próbkowania niż inne odbiorniki).
Czy ktoś inny to zetknął? Wszelkie pomysły dotyczące tego problemu zostaną z wdzięcznością przyjęte :)