Результаты поиска по запросу "text-mining"
Как воссоздать тот же DocumentTermMatrix с новыми (тестовыми) данными
Предположим, у меня есть текстовые данные обучения и данные тестирования. Чтобы быть более конкретным, у меня есть два набора данных - обучение и тестирование - и у каждого из них есть один столбец, который содержит текст и представляет интерес ...
findAssocs для нескольких терминов в R
В R я использовал[tm package][1] для построения матрицы термодокументов из совокупности документов. Моя цель - извлечь словосочетания извсебиграммы в терминах матрицы документов и возвращают для каждой из трех или нескольких лучших. Поэтому я ...
Сумма строки для большой матрицы срочных документов / simple_triplet_matrix ?? {тм пакет}
Итак, у меня есть очень большая матрица терм-документов:
Как рассчитать TF * IDF для одного нового документа для классификации?
Я использую векторы термина документа, чтобы представить коллекцию документа. я используюTF * IDF рассчитать вес термина для каждого вектора документа. Тогда...
В пакете R tm соберите корпус ОТ Document-Term-Matrix
Построить матрицу термина документа из корпуса с помощью пакета tm просто. Я хотел бы построить корпус из документа-термина-матрицы.Пусть M будет количеством...
создать список краевых совпадений слов в R
У меня есть кусок предложений, и я хочу создать список неориентированных ребер совместного использования слова и увидеть частоту каждого ребра. Я посмотрел на