а также
я есть серия, которая выглядит так:
col1 id
0 a 10
1 b 20
2 c 30
3 b 10
4 d 10
5 a 30
6 e 40
Мой желаемый вывод:
a b c d e
10 1 1 0 1 0
20 0 1 0 0 0
30 1 0 1 0 0
40 0 0 0 0 1
Я получил этот код:
import pandas as pd
df['dummies'] = 1
df_ind.pivot(index='id', columns='col1', values='dummies')
Я получаю ошибку:
137
138 if mask.sum() < len(self.index):
--> 139 raise ValueError('Index contains duplicate entries, '
140 'cannot reshape')
141
ValueError: Index contains duplicate entries, cannot reshape
Есть повторяющиеся идентификаторы, потому что несколько значений в столбце col1 могут быть отнесены к одному идентификатору.
Как я могу достичь желаемого результата?
Спасибо!