Заменить слова в корпусе в соответствии со словарем данных
Я заинтересован в замене всех слов вtm
Корпусный объект согласно словарю, составленному из фрейма данных из двух столбцов, где первый столбец - это слово для сопоставления, а второй столбец - слово для замены.
Я застрял сtranslate
функция. Я виделэтот ответ но я не могу превратить его в функцию для передачиtm_map
.
Пожалуйста, обратите внимание на следующее MWE
library(tm)
docs <- c("first text", "second text")
corp <- Corpus(VectorSource(docs))
dictionary <- data.frame(word = c('first', 'second', 'text'),
translation = c('primo', 'secondo', 'testo'))
translate <- function(text, dictionary) {
# Would like to replace each word of text with corresponding word in dictionary
}
corp_translated <- tm_map (corp, translate)
inspect(corp_translated)
# Expected result
# A corpus with 2 text documents
#
# The metadata consists of 2 tag-value pairs and a data frame
# Available tags are:
# create_date creator
# Available variables in the data frame are:
# MetaID
# [[1]]
# primo testo
# [[2]]
# secondo testo