R: bytes de caracteres UTF-8 como bytes de caracteres latino-1
Eu recebo bytes de caracteres UTF-8 como bytes de caracteres Latin-1. Exemplos contêm
Latin 1 character bytes ----- UTF-8 bytes
äännök ----- äännök
Ã<U+0084>Ã<U+0084>NÃ<U+0096>S ----- äänös
e minhas informações da sessão
> sessionInfo()
R version 3.3.2 (2016-10-31)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
Running under: macOS Sierra 10.12.1
locale:
[1] C/UTF-8/C/C/C/C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
Então, que tipo de configurações eu preciso no R para manipular tremas corretamente (para não retornar bytes UTF-8 como bytes de caracteres Latin-1)?
Relacionado?
Transforme Unicode em trema no R no Mac (dados do Facebook)
https://stackoverflow.com/a/22945233/164148
Aparentemente poresta, Eu preciso
Se você ligarSys.setlocale com"LC_CTYPE" ou "LC_ALL" Para alterar a localidade do sistema enquanto o RStudio está em execução, você pode encontrar alguns problemas menores, pois o RStudio assume que a codificação do sistema não muda. Se você estiver no Windows, recomendamos ligar apenasSys.setlocale em .Rprofile. Se você está no Mac ou Linux e deseja alterar o código do idioma do sistema, visite o fórum de suporte e informe-nos do seu cenário.
Existe alguma ferramenta simples para converter os bytes de caracteres latino-1 em bytes de caracteres UTF-8?P.s. Eu testei isso agora no R no Linux e R no OSX, tenho o mesmo problema de interpretar os bytes de caracteres UTF-8 como bytes de caracteres latinos-1.