groupby kolumny z wartościami NaN (brak)
Mam DataFrame z wieloma brakującymi wartościami w kolumnach, które chcę zgrupować:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']})
In [4]: df.groupby('b').groups
Out[4]: {'4': [0], '6': [2]}
zobacz, że Pandas upuścił rzędy z wartościami docelowymi NaN. (Chcę dołączyć te wiersze!)
Ponieważ potrzebuję wielu takich operacji (wiele kolumn ma brakujące wartości) i używam bardziej skomplikowanych funkcji niż tylko mediany (zazwyczaj losowe lasy), chcę uniknąć pisania zbyt skomplikowanych fragmentów kodu.
Jakieś sugestie? Czy powinienem napisać funkcję dla tego czy istnieje proste rozwiązanie?