Necessidade de transpor um dataframe de pandas
Eu tenho uma série que se parece com isso:
col1 id
0 a 10
1 b 20
2 c 30
3 b 10
4 d 10
5 a 30
6 e 40
Minha saída desejada é esta:
a b c d e
10 1 1 0 1 0
20 0 1 0 0 0
30 1 0 1 0 0
40 0 0 0 0 1
Eu recebi este código:
import pandas as pd
df['dummies'] = 1
df_ind.pivot(index='id', columns='col1', values='dummies')
Eu recebo um erro:
137
138 if mask.sum() < len(self.index):
--> 139 raise ValueError('Index contains duplicate entries, '
140 'cannot reshape')
141
ValueError: Index contains duplicate entries, cannot reshape
Existem IDs duplicados porque vários valores em col1 podem ser atribuídos a um único ID.
Como posso obter a saída desejada?
Obrigado!