Plotar o dataframe do pandas contendo NaNs
Eu tenho dados de GPS da velocidade do gelo de três diferentes receptores GPS. Os dados estão em um dataframe de pandas com um índice de dia juliano (incremental desde o início de 2009).
Este é um subconjunto dos dados (o conjunto de dados principal é 3487235 linhas ...):
R2 R7 R8
1235.000000 116.321959 100.805197 96.519977
1235.000116 NaN 100.771133 96.234957
1235.000231 NaN 100.584559 97.249262
1235.000347 118.823610 100.169055 96.777833
1235.000463 NaN 99.753551 96.598350
1235.000579 NaN 99.338048 95.283989
1235.000694 113.995003 98.922544 95.154067
O dataframe tem forma:
Index: 6071320 entries, 127.67291667 to 1338.51805556 Data columns: R2 3487235 non-null values R7 3875864 non-null values R8 1092430 non-null values dtypes: float64(3)
R2 amostrou em uma taxa diferente de R7 e R8, portanto, os NaNs que aparecem sistematicamente nesse espaçamento.
Tentandodf.plot()
plotar todo o dataframe (ou localizações de linhas indexadas) funciona bem em termos de plotagem de R7 e R8, mas não representa R2. Da mesma forma, apenas fazendodf.R2.plot()
também não funciona. A única maneira de traçar R2 é fazerdf.R2.dropna().plot()
, mas isso também remove NaNs, que significam períodos sem dados (em vez de apenas uma freqüência de amostragem mais grosseira do que os outros receptores).
Alguém mais se deparou com isso? Qualquer idéia sobre o problema seria recebida com gratidão :)