Leia um arquivo de texto UTF-8 com BOM

Question

Feb 07, 2014, 11:09 AM

utf-8 unicode byte-order-mark r character-encoding

Leia um arquivo de texto UTF-8 com BOM

Eu tenho um arquivo de texto com marca de ordem de bytes (U + FEFF) no início. Estou tentando ler o arquivo em R. É possível evitar a marca de pedido de bytes?

A funçãofread (dedata.table pacote) lê o arquivo, mas adicionaļ»æ no início do primeiro nome da variável:

> names(frame_pers)[1]
[1] "ļ»æreg_date"

O mesmo é comread.csv função.

Atualmente, criei uma função que remove a lista técnica do nome da primeira coluna, mas acredito que deve haver uma maneira de remover automaticamente a lista técnica.

remove.BOM <- function(x) setnames(x, 1, substring(names(x)[1], 4))

> names(frame_pers)[1]
[1] "ļ»æreg_date"
> remove.BOM(frame_pers)
> names(frame_pers)[1]
[1] "reg_date"

Estou usando a codificação nativa para a sessão R:

> options("encoding" = "")
> options("encoding")
$encoding
[1] ""

questionAnswers(2)

Perguntas populares

0 a resposta

Faça upload de arquivos grandes para o Google Drive com a biblioteca cliente PHP

0 a resposta

Consulta Zend Framework 2 e SELECT count (*)

0 a resposta

Mbrola FreeTTS não é capaz de encontrar o caminho

0 a resposta

Consulta SQL que fornece resultados distintos que correspondem a várias colunas

0 a resposta

Properties.Resources não carregando uma imagem

Você é muito ativo! É ótimo!

Leia um arquivo de texto UTF-8 com BOM

questionAnswers(2)

yourAnswerToTheQuestion

Perguntas populares