Результаты поиска по запросу "tm"
R Corpus испортил мой кодированный в UTF-8 текст
Я просто пытаюсь создать корпус из русского текста в кодировке UTF-8. Проблема в том, что метод Корпуса из
stemCompletion не работает
Я использую пакет tm для анализа текста восстановительных данных, чтения данных во фрейм данных, преобразования в объект Corpus, применяя различные методы дл...
Как работает removeSparseTerms в R?
Я использую метод removeSparseTerms в R, и это требует порогового значения для ввода. Я также читал, что чем выше значение, тем больше будет количество слага...
Попытка удалить слова из DocumentTermMatrix, чтобы использовать топические модели
Итак, я пытаюсь использоватьtopicmodels пакет дляR (100 тем в корпусе ~ 6400 документов, каждый из которых ~ 1000 слов). Процесс запускается, а затем умирает, я думаю, потому что у него заканчивается память. Поэтому я стараюсь уменьшить размер ...