R Tidytext y unnest_tokens error
Muy nuevo en R y he comenzado a usar el paquete tidytext.
Estoy tratando de usar argumentos para alimentar elunnest_tokens
funciono para poder hacer análisis de múltiples columnas. Entonces, en lugar de esto
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)
original_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup()
original_books
tidy_books <- original_books %>%
unnest_tokens(word, text)
La última línea de código sería:
output<- 'word'
input<- 'text'
tidy_books <- original_books %>%
unnest_tokens(output, input)
Pero estoy entendiendo esto:
Error en check_input (x): la entrada debe ser un vector de caracteres de cualquier longitud o una lista de vectores de caracteres, cada uno de los cuales tiene una longitud de 1.
He intentado usaras.character()
sin mucha suerte
¿Alguna idea de cómo funcionaría esto?