Вы можете попробовать следующее -
я есть следующая структура панд:
col1 col2 col3 text
1 1 0 meaningful text
5 9 7 trees
7 8 2 text
Я хотел бы векторизовать его с помощью векторизатора tfidf. Это, однако, возвращает матрицу разбора, которую я могу фактически превратить в плотную матрицу с помощьюmysparsematrix).toarray()
, Тем не менее, как я могу добавить эту информацию с метками к моей оригинальной DF? Таким образом, цель будет выглядеть так:
col1 col2 col3 meaningful text trees
1 1 0 1 1 0
5 9 7 0 0 1
7 8 2 0 1 0
ОБНОВИТЬ:
Решение делает объединение неправильным даже при переименовании исходных столбцов:Удаление столбцов хотя бы с одним NaN приводит к тому, что осталось всего 7 строк, хотя я использую
fillna(0)
прежде чем начать с ним работать.