Beste Übung: Soll ich versuchen, auf UTF-8 als Gebietsschema zu wechseln, oder ist es sicher, es so zu belassen, wie es ist?

Ich versuche, meine Standardkodierung auf UTF-8 einzustellen. bisher ohne erfolg:

a <- "Hallo"
b <- "äöfd"
print(Encoding(a))
# [1] "unknown"
print(Encoding(b))
# [1] "latin1"

options(encoding = "UTF-8")
a <- "Hallo"
b <- "äöfd"
print(Encoding(a))
# [1] "unknown"
print(Encoding(b))
# [1] "latin1"

old_locale <- Sys.getlocale()
Sys.setlocale(category = "LC_ALL", locale = "English_United States.1252")
a <- "Hallo"
b <- "äöfd"
print(Encoding(a))
# [1] "unknown"
print(Encoding(b))
# [1] "latin1"

Sys.getlocale()
# [1] "LC_COLLATE=German_Switzerland.1252;
# LC_CTYPE=German_Switzerland.1252;
# LC_MONETARY=German_Switzerland.1252;
# LC_NUMERIC=C;LC_TIME=German_Switzerland.1252"

Ich habe die folgenden Links gefundenR Kodierung für Dateien undWie verwende ich Sys.setlocale () aber wie du sehen kannst, scheinen sie in meinem Fall nicht zu funktionieren und ich verstehe nicht warum.

Ich habe es auch versuchtSys.setlocale(category = "LC_ALL", locale = "en_US.UTF-8") aber bekam

Warnmeldung: In Sys.setlocale (Kategorie = "LC_ALL", Gebietsschema = "en_US.UTF-8"): OS meldet, dass die Anforderung zum Festlegen des Gebietsschemas auf "en_US.UTF-8" nicht berücksichtigt werden kann

Imcmd der Befehlsysteminfo & pause gibt

Systemgebietsschema: de-ch; Deutsch (Schweiz) Eingabegebietsschema: de-ch; Deutsch (Schweiz)

Bearbeite:

Ich befürchte, dass"unknown" Encoding kann zu Fehlern führen, die mir nicht bekannt sind undIch fand es gut, den neuen Standard UTF-8 zu verwenden, um Probleme zu vermeiden, wie ich sie hatte.Last but not least möchte ich reproduzierbare Ergebnisse erzielen - ein Kollege arbeitet an einem Mac (mit weniger Problemen bei der Codierung) ...

Edit2: Wie ist die Erfahrung mit diesem Problem? Gibt es eine bewährte Methode?

Antworten auf die Frage(2)

Ihre Antwort auf die Frage