Результаты поиска по запросу "tm"
пакет wordcloud: получить «Ошибка в strwidth (…): недопустимое значение« cex »»
Я использую пакеты tm и wordcloud в R 2.15.1. Я пытаюсь сделать облако слов Вот код: maruti_tweets = userTimeline("Maruti_suzuki", n=1000,cainfo="cacert.pem") hyundai_tweets = userTimeline("HyundaiIndia", n=1000,cainfo="cacert.pem") tata_tweets ...
Как загрузить пакеты в R
Я успешно установилtm пакет, который находится в:C:\Users\JustinLiang\Documents\R\win-library\3.0 После типаlibrary(), он показывает мне список доступных пакетов R: Пакеты в библиотеке ‘C: /Users/JustinLiang/Documents/R/win-library/3.0’: Tm ...
R текстовый файл и текстовый майнинг ... как загрузить данные
Я использую пакет Rtm и я хочу заняться майнингом текста. Это один документ и рассматривается как мешок слов. Я не понимаю документацию о том, как загрузить текстовый файл и создать необходимые объекты, чтобы начать использовать такие функции, ...
R тм пакет: UTF-8 текст
Я хотел бы создать Wordcloud для неанглийского текста в UTF-8 (на самом деле, это на казахском языке). Текст отображается абсолютно правильно в функции проверки пакета TM. Однако, когда я ищу частоту слов, все отображается неправильно: Проблема ...
Используйте R для преобразования PDF-файлов в текстовые файлы для анализа текста
У меня есть около тысячи статей в журнале PDF в папке. Мне нужно написать текст на все тезисы статьи из всей папки. Сейчас я делаю следующее: dest <- "~/A1.pdf" # set path to pdftotxt.exe and convert pdf to text exe <- "C:/Program Files ...
Ошибка преобразования текста в нижний регистр с помощью tm_map (…, tolower)
Я пытался использоватьtm_map, Это дало следующую ошибку. Как я могу обойти это? require(tm) byword<-tm_map(byword, tolower) Error in UseMethod("tm_map", x) : no applicable method for 'tm_map' applied to an object of class "character"
Пример использования тм
Можете ли вы привести пример использованияtm (Я не знаю, как инициализировать этоstruct) где текущая дата записана в этом форматеy/m/d?
R: добавить заголовок в wordcloud graphics / png
У меня есть некоторый рабочий код R, который генерирует облако тегов из матрицы терминов. Теперь я хочу создать целую кучу облаков тегов из многих документов и позже проверить их визуально. Чтобы узнать, к какому документу (документам) / ...
Сделайте фрейм данных из N часто встречающихся терминов для нескольких корпораций, используя пакет tm в R
У меня есть несколькоTermDocumentMatrixs создан сtm пакет в R. Я хочу найти 10 самых частых терминов в каждом наборе документов, чтобы в конечном итоге получить следующую таблицу вывода: corpus1 corpus2 "beach" "city" "sand" "sidewalk" ... ... ...
tm: читать в фрейме данных, сохранять текстовые идентификаторы, создавать DTM и присоединяться к другому набору данных
Я использую пакет тм. Скажем, у меня есть фрейм данных из 2 столбцов, 500 строк. Первый столбец - это идентификатор, который генерируется случайным образом и содержит как символ, так и число: «txF87uyK». Второй столбец - это фактический текст: ...