Результаты поиска по запросу "text-mining"

1 ответ

Сделайте фрейм данных из N часто встречающихся терминов для нескольких корпораций, используя пакет tm в R

У меня есть несколько

2 ответа

Используйте R для преобразования PDF-файлов в текстовые файлы для анализа текста

У меня есть около тысячи статей в журнале PDF в папке. Мне нужно написать текст на все тезисы статьи из всей папки. Сейчас я делаю следующее: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to text exe <- "C:/Program Files ...

0 ответов

 подход с вашей собственной пользовательской функцией против другого пакета, вероятно, намного лучше как в краткосрочной, так и в долгосрочной перспективе.

дин потенциальный заголовок для этого поста: «При параллельной обработке в r имеет значение соотношение между числом ядер, размером фрагмента цикла и размером объекта?» У меня есть корпус, я запускаю некоторые преобразования с использованием ...

ТОП публикаций

1 ответ

По большей части эти два вектора указывают в одном направлении (большие координаты будут доминировать над меньшими различиями в другой координате). Ожидается косинусное сходство ~ 1 (Помните, что cos (0) = 1)

ользую формулу косинусного сходства, чтобы рассчитать сходство между двумя векторами. Я пробовал два разных вектора, как это:Vector1 (-1237373741, 27, 1, 1, ...

2 ответа

Используйте больше данных ...

аюсь получить биграммы в предложениях, используя фразы в Gensim следующим образом. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning can be ...

3 ответа

Как рассчитать TF * IDF для одного нового документа для классификации?

Я использую векторы термина документа, чтобы представить коллекцию документа. я используюTF * IDF рассчитать вес термина для каждого вектора документа. Тогда...

3 ответа

анализ настроений - WordNet, словарь sentiWordNet

Мне нужен список положительных и отрицательных слов свеса присваивать слова в зависимости от того, насколько они сильны и неделями. У меня есть :1.) WordNet ...

3 ответа

Как использовать OpenNLP для получения POS-тегов в R?

1 ответ

R Tidytext и unnest_tokens error

1 ответ

Ошибка памяти в python при использовании массива numpy

Я получаю следующую ошибку для этого кода: