Subtraindo o valor específico do grupo das linhas nos pandas
No Pandas, tenho um quadro de dados composto por dois grupos com várias amostras em cada grupo. Cada grupo tem um valor de referência interno que eu quero subtrair de todos os valores de amostra dentro desse grupo.
s = u"""Group sample value
group1 ref1 18.1
group1 smp1 NaN
group1 smp2 20.3
group1 smp3 30.0
group2 ref2 16.1
group2 smp4 29.2
group2 smp5 19.9
group2 smp6 28.9
"""
df = pd.read_csv(io.StringIO(s), sep='\s+')
df = df.set_index(['Group', 'sample'])
df
Out[82]:
value
Group sample
group1 ref1 18.1
smp1 NaN
smp2 20.3
smp3 30.0
group2 ref2 16.1
smp4 29.2
smp5 19.9
smp6 28.9
O que eu quero fazer é adicionar uma nova coluna onde a referência (ref) foi subtraída de todas as amostras (smp) dentro de cada grupo respectivo. Como isso:
value deltaValue
SampleGroup sample
Group1 ref 18.1 0
smp1 NaN NaN
smp2 20.3 2.2
smp3 30.0 11.9
Group2 ref2 16.1 0
smp4 29.2 13.1
smp5 19.9 3.8
smp6 28.9 12.8
alguém sabe como isto pode ser feito? Obrigado!