Результаты поиска по запросу "text-mining"
Используйте R для преобразования PDF-файлов в текстовые файлы для анализа текста
У меня есть около тысячи статей в журнале PDF в папке. Мне нужно написать текст на все тезисы статьи из всей папки. Сейчас я делаю следующее: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to text exe <- "C:/Program Files ...
подход с вашей собственной пользовательской функцией против другого пакета, вероятно, намного лучше как в краткосрочной, так и в долгосрочной перспективе.
дин потенциальный заголовок для этого поста: «При параллельной обработке в r имеет значение соотношение между числом ядер, размером фрагмента цикла и размером объекта?» У меня есть корпус, я запускаю некоторые преобразования с использованием ...
По большей части эти два вектора указывают в одном направлении (большие координаты будут доминировать над меньшими различиями в другой координате). Ожидается косинусное сходство ~ 1 (Помните, что cos (0) = 1)
ользую формулу косинусного сходства, чтобы рассчитать сходство между двумя векторами. Я пробовал два разных вектора, как это:Vector1 (-1237373741, 27, 1, 1, ...
Используйте больше данных ...
аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...
Как рассчитать TF * IDF для одного нового документа для классификации?
Я использую векторы термина документа, чтобы представить коллекцию документа. я используюTF * IDF рассчитать вес термина для каждого вектора документа. Тогда...
анализ настроений - WordNet, словарь sentiWordNet
Мне нужен список положительных и отрицательных слов свеса присваивать слова в зависимости от того, насколько они сильны и неделями. У меня есть :1.) WordNet ...
Ошибка памяти в python при использовании массива numpy
Я получаю следующую ошибку для этого кода: