Результаты поиска по запросу "tm"

R + tm: Как мне дублировать элементы в списке на основе семантического сходства?

@np. Если ответ был полезным, пожалуйста, uptick. Благодарю.

аюсь установить 0,6-2 версию библиотеки ТМ. Я скачал файл tar.gz сархив и в RStudio выберите Tools -> Archive -> Package Archive File для его установки...

r n-gram tokenize rweka

1 ответ

но, кажется, нет удовлетворительного объяснения.

аюсь сделать две матрицы документов для корпуса, одну с униграммами и одну с биграммами. Тем не менее, матрица биграммы в настоящее время просто идентична ма...

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

n-gram rweka r term-document-matrix

1 ответ

Я работал с R.3.4.1 и перешел на R3.3.3, теперь решение VCorpus работает для меня. И TM, и RWeka создают биграммы правильно.

r text-processing term-document-matrix matrix

1 ответ

(PS: действительно печально, что пакеты обработки текста R настолько балканизированы ... так много людей работают над кросс-целями и яростно изобретают колеса ... но иногда это происходит по нескольким причинам.)

r qdap split sentence

7 ответов

R разбить корпус на предложения

У меня есть ряд документов в формате PDF, которые я прочитал в корпусе с библиотекойtm, Как можно разбить корпус на предложения? Это можно сделать, прочитав файл сreadLines с последующимsentSplit из пакетаqdap [*]. Эта функция требует фрейма ...

r text-mining doparallel parallel-processing

0 ответов

подход с вашей собственной пользовательской функцией против другого пакета, вероятно, намного лучше как в краткосрочной, так и в долгосрочной перспективе.

дин потенциальный заголовок для этого поста: «При параллельной обработке в r имеет значение соотношение между числом ядер, размером фрагмента цикла и размером объекта?» У меня есть корпус, я запускаю некоторые преобразования с использованием ...

r nlp

2 ответа

Заменить слова в корпусе в соответствии со словарем данных

Я заинтересован в замене всех слов вtm Корпусный объект согласно словарю, составленному из фрейма данных из двух столбцов, где первый столбец - это слово для сопоставления, а второй столбец - слово для замены. Я застрял сtranslate функция. Я ...

graphviz r

1 ответ

Составьте высококоррелированные слова по отношению к конкретному слову интереса [закрыто]

Я пытаюсь построить высшую корреляцию слова. Например, я хочу изобразить десять самых высоких корреляций слова «кит». Может кто-нибудь помочь мне с командой для чего-то подобного? У меня установлен RGraphViz, если это ...

n-gram text-mining r

4 ответа

Нахождение нграмм в R и сравнение нграмм по всем корпорациям

Я начинаю работать с пакетом tm в R, так что, пожалуйста, потерпите меня и приносим извинения за большую старую стену текста. Я создал довольно большой корпус социалистической / коммунистической пропаганды и хотел бы извлечь недавно придуманные ...

Страница 6 из 7

3 4 567

Результаты поиска по запросу "tm"

удалить дубликаты из списка на основе семантического сходства

@np. Если ответ был полезным, пожалуйста, uptick. Благодарю.

но, кажется, нет удовлетворительного объяснения.

Популярные теги

ТОП публикаций

Я работал с R.3.4.1 и перешел на R3.3.3, теперь решение VCorpus работает для меня. И TM, и RWeka создают биграммы правильно.

R разбить корпус на предложения

подход с вашей собственной пользовательской функцией против другого пакета, вероятно, намного лучше как в краткосрочной, так и в долгосрочной перспективе.

Заменить слова в корпусе в соответствии со словарем данных

Составьте высококоррелированные слова по отношению к конкретному слову интереса [закрыто]

Нахождение нграмм в R и сравнение нграмм по всем корпорациям

Вы очень активны! Это здорово!

Результаты поиска по запросу "tm"

Популярные теги

ТОП публикаций