Lesen Sie eine UTF-8-Textdatei mit Stückliste
Ich habe am Anfang eine Textdatei mit der Markierung für die Byte-Reihenfolge (U + FEFF). Ich versuche, die Datei in R zu lesen. Ist es möglich, die Markierung für die Byte-Reihenfolge zu umgehen?
Die Funktionfread
(von demdata.table
package) liest die Datei, fügt sie jedoch hinzuļ»æ
am Anfang des ersten Variablennamens:
> names(frame_pers)[1]
[1] "ļ»æreg_date"
Das selbe ist mitread.csv
Funktion.
Derzeit habe ich eine Funktion erstellt, mit der die Stückliste aus dem Namen der ersten Spalte entfernt wird. Ich glaube jedoch, dass es eine Möglichkeit geben sollte, die Stückliste automatisch zu entfernen.
remove.BOM <- function(x) setnames(x, 1, substring(names(x)[1], 4))
> names(frame_pers)[1]
[1] "ļ»æreg_date"
> remove.BOM(frame_pers)
> names(frame_pers)[1]
[1] "reg_date"
Ich verwende die native Codierung für die R-Sitzung:
> options("encoding" = "")
> options("encoding")
$encoding
[1] ""