Subtraindo o valor específico do grupo das linhas nos pandas

Question

May 15, 2015, 01:58 PM

Subtraindo o valor específico do grupo das linhas nos pandas

No Pandas, tenho um quadro de dados composto por dois grupos com várias amostras em cada grupo. Cada grupo tem um valor de referência interno que eu quero subtrair de todos os valores de amostra dentro desse grupo.

s = u"""Group    sample    value
group1    ref1    18.1
group1    smp1    NaN
group1    smp2    20.3
group1    smp3    30.0
group2    ref2    16.1
group2    smp4    29.2
group2    smp5    19.9
group2    smp6    28.9
"""
df = pd.read_csv(io.StringIO(s), sep='\s+')
df = df.set_index(['Group', 'sample'])
df

Out[82]: 

                 value    
Group    sample
group1   ref1    18.1
         smp1    NaN
         smp2    20.3
         smp3    30.0
group2   ref2    16.1
         smp4    29.2
         smp5    19.9
         smp6    28.9

O que eu quero fazer é adicionar uma nova coluna onde a referência (ref) foi subtraída de todas as amostras (smp) dentro de cada grupo respectivo. Como isso:

                   value   deltaValue
SampleGroup   sample              
Group1        ref      18.1    0
              smp1     NaN     NaN
              smp2     20.3    2.2
              smp3     30.0    11.9
Group2        ref2     16.1    0
              smp4     29.2    13.1
              smp5     19.9    3.8
              smp6     28.9    12.8

alguém sabe como isto pode ser feito? Obrigado!

leaveComments