Plotten Sie Pandas-Datenrahmen mit NaNs
Ich habe GPS-Daten der Eisgeschwindigkeit von drei verschiedenen GPS-Empfängern. Die Daten befinden sich in einem Pandas-Datenframe mit einem Index für den Juli-Tag (inkrementell ab Anfang 2009).
Dies ist eine Teilmenge der Daten (der Hauptdatensatz ist 3487235 Zeilen ...):
R2 R7 R8
1235.000000 116.321959 100.805197 96.519977
1235.000116 NaN 100.771133 96.234957
1235.000231 NaN 100.584559 97.249262
1235.000347 118.823610 100.169055 96.777833
1235.000463 NaN 99.753551 96.598350
1235.000579 NaN 99.338048 95.283989
1235.000694 113.995003 98.922544 95.154067
Der Datenrahmen hat folgende Form:
Index: 6071320 entries, 127.67291667 to 1338.51805556 Data columns: R2 3487235 non-null values R7 3875864 non-null values R8 1092430 non-null values dtypes: float64(3)
R2 wurde mit einer anderen Rate als R7 und R8 abgetastet, daher die NaNs, die systematisch in diesem Abstand auftreten.
Versuchendf.plot()
Das Plotten des gesamten Datenrahmens (oder seiner indizierten Zeilenpositionen) funktioniert beim Plotten von R7 und R8, nicht jedoch beim Plotten von R2. Ebenso einfach zu tundf.R2.plot()
funktioniert auch nicht. Der einzige Weg, R2 zu zeichnen, ist zu tundf.R2.dropna().plot()
Dies entfernt jedoch auch NaNs, die Perioden ohne Daten anzeigen (und nicht nur eine gröbere Abtastfrequenz als die anderen Empfänger).
Ist dies noch jemandem begegnet? Irgendwelche Ideen zu dem Problem wären dankbar :)