Leia um arquivo de texto UTF-8 com BOM
Eu tenho um arquivo de texto com marca de ordem de bytes (U + FEFF) no início. Estou tentando ler o arquivo em R. É possível evitar a marca de pedido de bytes?
A funçãofread
(dedata.table
pacote) lê o arquivo, mas adiciona
no início do primeiro nome da variável:
> names(frame_pers)[1]
[1] "reg_date"
O mesmo é comread.csv
função.
Atualmente, criei uma função que remove a lista técnica do nome da primeira coluna, mas acredito que deve haver uma maneira de remover automaticamente a lista técnica.
remove.BOM <- function(x) setnames(x, 1, substring(names(x)[1], 4))
> names(frame_pers)[1]
[1] "reg_date"
> remove.BOM(frame_pers)
> names(frame_pers)[1]
[1] "reg_date"
Estou usando a codificação nativa para a sessão R:
> options("encoding" = "")
> options("encoding")
$encoding
[1] ""