R: bytes de caracteres UTF-8 como bytes de caracteres latino-1

Question

Jan 26, 2017, 01:22 PM

R: bytes de caracteres UTF-8 como bytes de caracteres latino-1

Eu recebo bytes de caracteres UTF-8 como bytes de caracteres Latin-1. Exemplos contêm

Latin 1 character bytes        ----- UTF-8 bytes
Ã¤Ã¤nnÃ¶k                      ----- äännök
Ã<U+0084>Ã<U+0084>NÃ<U+0096>S  ----- äänös

e minhas informações da sessão

> sessionInfo()
R version 3.3.2 (2016-10-31)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: macOS Sierra 10.12.1

locale:
[1] C/UTF-8/C/C/C/C

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base

Então, que tipo de configurações eu preciso no R para manipular tremas corretamente (para não retornar bytes UTF-8 como bytes de caracteres Latin-1)?

Relacionado?

Transforme Unicode em trema no R no Mac (dados do Facebook)

https://stackoverflow.com/a/22945233/164148

Aparentemente poresta, Eu preciso

Se você ligarSys.setlocale com"LC_CTYPE" ou "LC_ALL" Para alterar a localidade do sistema enquanto o RStudio está em execução, você pode encontrar alguns problemas menores, pois o RStudio assume que a codificação do sistema não muda. Se você estiver no Windows, recomendamos ligar apenasSys.setlocale em .Rprofile. Se você está no Mac ou Linux e deseja alterar o código do idioma do sistema, visite o fórum de suporte e informe-nos do seu cenário.

Existe alguma ferramenta simples para converter os bytes de caracteres latino-1 em bytes de caracteres UTF-8?

P.s. Eu testei isso agora no R no Linux e R no OSX, tenho o mesmo problema de interpretar os bytes de caracteres UTF-8 como bytes de caracteres latinos-1.