R Texto de arrumação e erro unnest_tokens

Question

Aug 30, 2016, 04:13 AM

R Texto de arrumação e erro unnest_tokens

Muito novo no R e começou a usar o pacote tidytext.

Estou tentando usar argumentos para alimentar ounnest_tokens função para que eu possa fazer várias análises de coluna. Então, ao invés disso

library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)

original_books <- austen_books() %>%
  group_by(book) %>%
  mutate(linenumber = row_number(),
         chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
                                                 ignore_case = TRUE)))) %>%
  ungroup()

original_books

tidy_books <- original_books %>%
              unnest_tokens(word, text)

A última linha de código seria:

output<- 'word'
input<- 'text'

tidy_books <- original_books %>%
              unnest_tokens(output, input)

Mas eu estou entendendo isso:

Erro no check_input (x): a entrada deve ser um vetor de caractere de qualquer tamanho ou uma lista de vetores de caracteres, cada um com um comprimento de 1.

Eu tentei usaras.character() sem muita sorte.

Alguma idéia de como isso funcionaria?