Python Groupby com máscara booleana

Question

Oct 31, 2018, 11:39 PM

Python Groupby com máscara booleana

Tenho um dataframe de pandas com o seguinte formato geral:

id,atr1,atr2,orig_date,fix_date
1,bolt,l,2000-01-01,nan
1,screw,l,2000-01-01,nan
1,stem,l,2000-01-01,nan
2,stem,l,2000-01-01,nan
2,screw,l,2000-01-01,nan
2,stem,l,2001-01-01,2001-01-01
3,bolt,r,2000-01-01,nan
3,stem,r,2000-01-01,nan
3,bolt,r,2001-01-01,2001-01-01
3,stem,r,2001-01-01,2001-01-01

Este resultado seria o seguinte:

id,atr1,atr2,orig_date,fix_date,failed_part_ind
1,bolt,l,2000-01-01,nan,0
1,screw,l,2000-01-01,nan,0
1,stem,l,2000-01-01,nan,0
2,stem,l,2000-01-01,nan,1
2,screw,l,2000-01-01,nan,0
2,stem,l,2001-01-01,2001-01-01,0
3,bolt,r,2000-01-01,nan,1
3,stem,r,2000-01-01,nan,1
3,bolt,r,2001-01-01,2001-01-01,0
3,stem,r,2001-01-01,2001-01-01,0

Quaisquer dicas ou truques bem-vindos!

Update2:

Uma maneira melhor de descrever o que eu preciso realizar é que, em um.groupby(['id','atr1','atr2']) para criar uma nova coluna de indicador onde os seguintes critérios são atendidos para registros dentro dos grupos: