Czytaj tekst jako kodowanie UTF-8
Załóżmy, że piszę funkcję, która analizuje strumień wejściowy zawierający niemiecki. Poniżej przykład zabawki. Następujące funkcje działają na moim komputerze (ponieważ UTF8 jest standardem):
readLines(textConnection("Zürich"))
readLines(textConnection("Z\u00FCrich")) #same thing
Jednak chcę się upewnić, że działa również wtedy, gdyUTF-8
nie jest bieżącym kodowaniem ustawień regionalnych. Na przykład wewnątrz rApache domyślnieascii
. Dlatego przekazuję parametr kodowania:
readLines(textConnection("Zürich", encoding="UTF-8"))
readLines(textConnection("Z\u00FCrich", encoding="UTF-8"))
Ale w rzeczywistości powoduje to, że dane wyjściowe są zawalone. Dlaczego to? Jak mam zadzwonić?textConnection
aby upewnić się, że strumień zostanie poprawnie odczytany na dowolnej platformie lub lokalizacji?