параметр, но вы можете переименовать имена столбцов возвращенного фиктивного элемента данных:
м фрейме данных у меня есть категориальная переменная, которую я хотел бы преобразовать в фиктивные переменные. Однако этот столбец имеет несколько значений, разделенных запятыми:
0 'a'
1 'a,b,c'
2 'a,b,d'
3 'd'
4 'c,d'
В конечном счете, я хотел бы иметь двоичные столбцы для каждого возможного дискретного значения; другими словами, итоговое количество столбцов равно количеству уникальных значений в исходном столбце. Я предполагаю, что мне придется использовать split (), чтобы получить каждое отдельное значение, но не уверен, что делать потом. Любой намек очень ценится!
Изменить: дополнительный поворот. Столбец имеет нулевые значения. И в ответ на комментарий, следующий желаемый результат. Спасибо!
a b c d
0 1 0 0 0
1 1 1 1 0
2 1 1 0 1
3 0 0 0 1
4 0 0 1 1