R Texto de arrumação e erro unnest_tokens
Muito novo no R e começou a usar o pacote tidytext.
Estou tentando usar argumentos para alimentar ounnest_tokens
função para que eu possa fazer várias análises de coluna. Então, ao invés disso
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)
original_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup()
original_books
tidy_books <- original_books %>%
unnest_tokens(word, text)
A última linha de código seria:
output<- 'word'
input<- 'text'
tidy_books <- original_books %>%
unnest_tokens(output, input)
Mas eu estou entendendo isso:
Erro no check_input (x): a entrada deve ser um vetor de caractere de qualquer tamanho ou uma lista de vetores de caracteres, cada um com um comprimento de 1.
Eu tentei usaras.character()
sem muita sorte.
Alguma idéia de como isso funcionaria?