Leer texto como codificación UTF-8
Supongamos que escribo una función que analiza un flujo de entrada que contiene alemán. Abajo un ejemplo de juguete. Lo siguiente funciona en mi máquina (porque UTF8 es estándar):
readLines(textConnection("Zürich"))
readLines(textConnection("Z\u00FCrich")) #same thing
Sin embargo, quiero asegurarme de que funcione también cuandoUTF-8
no es la codificación local actual. Por ejemplo, dentro de rApache, el valor predeterminado esascii
. De ahí que pase el parámetro de codificación:
readLines(textConnection("Zürich", encoding="UTF-8"))
readLines(textConnection("Z\u00FCrich", encoding="UTF-8"))
Pero esto en realidad hace que la salida se confunda. ¿Por qué es esto? Como debo llamartextConnection
¿Para asegurarse de que la transmisión se lea correctamente en cualquier plataforma o ubicación?