Результаты поиска по запросу "tm"

2 ответа

пакет wordcloud: получить «Ошибка в strwidth (…): недопустимое значение« cex »»

Я использую пакеты tm и wordcloud в R 2.15.1. Я пытаюсь сделать облако слов Вот код: maruti_tweets = userTimeline("Maruti_suzuki", n=1000,cainfo="cacert.pem") hyundai_tweets = userTimeline("HyundaiIndia", n=1000,cainfo="cacert.pem") tata_tweets ...

2 ответа

Как загрузить пакеты в R

Я успешно установилtm пакет, который находится в:C:\Users\JustinLiang\Documents\R\win-library\3.0 После типаlibrary(), он показывает мне список доступных пакетов R: Пакеты в библиотеке ‘C: /Users/JustinLiang/Documents/R/win-library/3.0’: Tm ...

5 ответов

R текстовый файл и текстовый майнинг ... как загрузить данные

Я использую пакет Rtm и я хочу заняться майнингом текста. Это один документ и рассматривается как мешок слов. Я не понимаю документацию о том, как загрузить текстовый файл и создать необходимые объекты, чтобы начать использовать такие функции, ...

ТОП публикаций

2 ответа

R тм пакет: UTF-8 текст

Я хотел бы создать Wordcloud для неанглийского текста в UTF-8 (на самом деле, это на казахском языке). Текст отображается абсолютно правильно в функции проверки пакета TM. Однако, когда я ищу частоту слов, все отображается неправильно: Проблема ...

2 ответа

Используйте R для преобразования PDF-файлов в текстовые файлы для анализа текста

У меня есть около тысячи статей в журнале PDF в папке. Мне нужно написать текст на все тезисы статьи из всей папки. Сейчас я делаю следующее: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to text exe <- "C:/Program Files ...

4 ответа

Ошибка преобразования текста в нижний регистр с помощью tm_map (…, tolower)

Я пытался использоватьtm_map, Это дало следующую ошибку. Как я могу обойти это? require(tm) byword<-tm_map(byword, tolower) Error in UseMethod("tm_map", x) : no applicable method for 'tm_map' applied to an object of class "character"

1 ответ

Пример использования тм

Можете ли вы привести пример использованияtm (Я не знаю, как инициализировать этоstruct) где текущая дата записана в этом форматеy/m/d?

2 ответа

R: добавить заголовок в wordcloud graphics / png

У меня есть некоторый рабочий код R, который генерирует облако тегов из матрицы терминов. Теперь я хочу создать целую кучу облаков тегов из многих документов и позже проверить их визуально. Чтобы узнать, к какому документу (документам) / ...

1 ответ

Сделайте фрейм данных из N часто встречающихся терминов для нескольких корпораций, используя пакет tm в R

У меня есть несколькоTermDocumentMatrixs создан сtm пакет в R. Я хочу найти 10 самых частых терминов в каждом наборе документов, чтобы в конечном итоге получить следующую таблицу вывода: corpus1 corpus2 "beach" "city" "sand" "sidewalk" ... ... ...

5 ответов

tm: читать в фрейме данных, сохранять текстовые идентификаторы, создавать DTM и присоединяться к другому набору данных

Я использую пакет тм. Скажем, у меня есть фрейм данных из 2 столбцов, 500 строк. Первый столбец - это идентификатор, который генерируется случайным образом и содержит как символ, так и число: «txF87uyK». Второй столбец - это фактический текст: ...