Wyjście pliku UTF-8 w R
Używam R 2.15.0 w Windows 7 64-bit. Chciałbym wypisać tekst Unicode (CJK) do pliku.
Poniższy kod pokazuje, w jaki sposób znak Unicode wysyłany do zapisu na połączeniu plików UTF-8 nie działa zgodnie z oczekiwaniami (I):
rty <- file("test.txt",encoding="UTF-8")
write("在", file=rty)
close(rty)
rty <- file("test.txt",encoding="UTF-8")
scan(rty,what=character())
close(rty)
Jak pokazuje wynik skanowania:
Read 1 item
[1] "<U+5728>"
Plik nie został zapisany z samym znakiem UTF, ale z pewnym rodzajem rezerwy zgodnej z ANSI. Czy mogę sprawić, by działał poprawnie za pierwszym razem (tj. Z plikiem tekstowym, w którym zamiast niego znajduje się „在”), czy też mogę pracować z dodatkową magią, aby przekonwertować dane wyjściowe na Unicode z odpowiednim znakiem zastępującym ciąg kodu?
Dzięki.
[Więcej informacji: zachowuje się ten sam kodprawidłowo w Cygwin, R 2.14.2, podczas gdy 2.14.2 na Win7 jest również zepsuty. Czy to gdzieś na moim końcu?]