тогда вы могли бы использовать, чтобы создать новый столбец горячих векторов
я есть датафрейм панд, похожий на этот:
Col1 ABC
0 XYZ A
1 XYZ B
2 XYZ C
Используя пандget_dummies()
Функция на столбце ABC, я могу получить это:
Col1 A B C
0 XYZ 1 0 0
1 XYZ 0 1 0
2 XYZ 0 0 1
Хотя мне нужно что-то вроде этого, где столбец ABC имеетlist / array
тип данных:
Col1 ABC
0 XYZ [1,0,0]
1 XYZ [0,1,0]
2 XYZ [0,0,1]
Я пытался использоватьget_dummies
функция, а затем объединение всех столбцов в столбец, который я хотел. Я нашел много ответов, объясняющих, как объединить несколько столбцов в виде строк, например:Объедините два столбца текста в dataframe в pandas / python, Но я не могу найти способ объединить их в список.
Этот вопрос ввел идею использования склеарнаOneHotEncoder
, но я не мог заставить его работать.Как горячим образом кодировать один столбец кадра данных панд?
Еще одна вещь: у всех ответов, с которыми я столкнулся, были решения, в которых имена столбцов нужно было вводить вручную при их объединении. Есть ли способ использоватьDataframe.iloc()
или механизм объединения для объединения столбцов в список?