Результаты поиска по запросу "text-mining"

4 ответа

Нахождение нграмм в R и сравнение нграмм по всем корпорациям

Я начинаю работать с пакетом tm в R, так что, пожалуйста, потерпите меня и приносим извинения за большую старую стену текста. Я создал довольно большой корпус социалистической / коммунистической пропаганды и хотел бы извлечь недавно придуманные ...

4 ответа

@ user757256: да, Jython немного медленнее и требует больше памяти. Взломайте какой-нибудь прототип, сравните с CPython и Jython, а затем посмотрите, что вы можете оптимизировать. И снова сделайте свой выбор только после оценки, какие библиотеки вы можете использовать.

ро начну новый проект, в котором собираюсь выполнять множество задач по обработке текста, таких как поиск, категоризация / классификация, кластеризация и так далее. Там будет огромное количество документов, которые должны быть ...

2 ответа

Здесь он используется, получая сведения о вкладе и пользовательские данные для группы пользователей:

ли какой-нибудь пакет для R, который позволяет запрашивать Википедию (скорее всего, с помощью Mediawiki API), чтобы получить список доступных статей, относящихся к такому запросу, а также импортировать выбранные статьи для анализа текста?

ТОП публикаций

2 ответа

Пожалуйста, попробуйте дать четкие ответы. ОП может не понять вас, если остальные не могут

ал несколько вопросов о текстовом майнинге неделю назад, но я был немного растерян и все еще, но теперь я знаю, что хочу сделать. Ситуация:У меня много страниц для скачивания с HTML-контентом. Некоторые из них могут быть, например, текстом из ...

5 ответов

R текстовый файл и текстовый майнинг ... как загрузить данные

Я использую пакет Rtm и я хочу заняться майнингом текста. Это один документ и рассматривается как мешок слов. Я не понимаю документацию о том, как загрузить текстовый файл и создать необходимые объекты, чтобы начать использовать такие функции, ...

4 ответа

Подсчет слогов

Я хочу назначить несколько различных показателей читабельности для текста в R, например, Flesh Kincaid. Кто-нибудь знает способ разбить слова на слоги, используя R? Мне не обязательно нужны сами сегменты слогов, но есть счет. так, например: x ...

4 ответа

Какой инструментарий НЛП использовать в JAVA? [закрыто]

Я работаю над проектом, который состоит из веб-сайта, который подключается к NCBI (Национальный центр биотехнологической информации), и ищет там статьи. Дело в том, что мне нужно провести анализ текста по всем результатам. Я использую язык JAVA ...

1 ответ

Расчет получения информации для текстового файла?

Я работаю на«классификация текста с использованием получения информации, PCA и генетического алгоритма»Но после выполненияпредварительная обработка(Стеблинг, удаление стоп-слов, TFIDF) на документе, я не понимал, как двигаться дальше ...

2 ответа

Используйте R для преобразования PDF-файлов в текстовые файлы для анализа текста

У меня есть около тысячи статей в журнале PDF в папке. Мне нужно написать текст на все тезисы статьи из всей папки. Сейчас я делаю следующее: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to text exe <- "C:/Program Files ...

3 ответа

анализ настроений - WordNet, словарь sentiWordNet

Мне нужен список положительных и отрицательных слов свесаприсваивать слова в зависимости от того, насколько они сильны и неделями. У меня есть : 1.) WordNet - дает оценку + или - для каждого слова. 2.) SentiWordNet - выдача положительных и ...