Как я могу вручную установить идентификатор документа в корпусе?
Я создаю Копус из данных. Я передаю это какVectorSource
поскольку есть только один столбец, я хочу использовать его в качестве источника текста. Это работает найти, однако мне нужно идентификаторы документов в корпусе, чтобы соответствовать идентификаторы документов из кадра данных. Идентификаторы документов хранятся в отдельном столбце в исходном кадре данных.
df