Результаты поиска по запросу "tm"

1 ответ

удалить дубликаты из списка на основе семантического сходства

R + tm: Как мне дублировать элементы в списке на основе семантического сходства?

1 ответ

@np. Если ответ был полезным, пожалуйста, uptick. Благодарю.

аюсь установить 0,6-2 версию библиотеки ТМ. Я скачал файл tar.gz сархив и в RStudio выберите Tools -> Archive -> Package Archive File для его установки...

1 ответ

 но, кажется, нет удовлетворительного объяснения.

аюсь сделать две матрицы документов для корпуса, одну с униграммами и одну с биграммами. Тем не менее, матрица биграммы в настоящее время просто идентична ма...

ТОП публикаций

1 ответ

Я работал с R.3.4.1 и перешел на R3.3.3, теперь решение VCorpus работает для меня. И TM, и RWeka создают биграммы правильно.

1 ответ

(PS: действительно печально, что пакеты обработки текста R настолько балканизированы ... так много людей работают над кросс-целями и яростно изобретают колеса ... но иногда это происходит по нескольким причинам.)

7 ответов

R разбить корпус на предложения

У меня есть ряд документов в формате PDF, которые я прочитал в корпусе с библиотекойtm, Как можно разбить корпус на предложения? Это можно сделать, прочитав файл сreadLines с последующимsentSplit из пакетаqdap [*]. Эта функция требует фрейма ...

0 ответов

 подход с вашей собственной пользовательской функцией против другого пакета, вероятно, намного лучше как в краткосрочной, так и в долгосрочной перспективе.

дин потенциальный заголовок для этого поста: «При параллельной обработке в r имеет значение соотношение между числом ядер, размером фрагмента цикла и размером объекта?» У меня есть корпус, я запускаю некоторые преобразования с использованием ...

2 ответа

Заменить слова в корпусе в соответствии со словарем данных

Я заинтересован в замене всех слов вtm Корпусный объект согласно словарю, составленному из фрейма данных из двух столбцов, где первый столбец - это слово для сопоставления, а второй столбец - слово для замены. Я застрял сtranslate функция. Я ...

1 ответ

Составьте высококоррелированные слова по отношению к конкретному слову интереса [закрыто]

Я пытаюсь построить высшую корреляцию слова. Например, я хочу изобразить десять самых высоких корреляций слова «кит». Может кто-нибудь помочь мне с командой для чего-то подобного? У меня установлен RGraphViz, если это ...

4 ответа

Нахождение нграмм в R и сравнение нграмм по всем корпорациям

Я начинаю работать с пакетом tm в R, так что, пожалуйста, потерпите меня и приносим извинения за большую старую стену текста. Я создал довольно большой корпус социалистической / коммунистической пропаганды и хотел бы извлечь недавно придуманные ...