Crie dummies da coluna com múltiplos valores em pandas
Eu estou procurando uma maneira pythonic para lidar com o seguinte problema.
opandas.get_dummies()
O método é ótimo para criar dummies a partir de uma coluna categórica de um dataframe. Por exemplo, se a coluna tiver valores em['A', 'B']
, get_dummies()
cria 2 variáveis fictícias e atribui 0 ou 1 de acordo.
Agora preciso lidar com essa situação. Uma única coluna, vamos chamá-lo de "rótulo", tem valores como['A', 'B', 'C', 'D', 'A*C', 'C*D']
. get_dummies()
cria 6 dummies, mas eu só quero 4 deles, para que uma linha possa ter vários 1s.
Existe uma maneira de lidar com isso de um modo pietônico? Eu só poderia pensar em algum algoritmo passo-a-passo para obtê-lo, mas isso não incluiria get_dummies (). obrigado
Editado, espero que seja mais claro!