Прочитайте текстовый файл UTF-8 с BOM
У меня есть текстовый файл с меткой порядка байтов (U + FEFF) в начале. Я пытаюсь прочитать файл в R. Можно ли избежать метки порядка байтов?
Функцияfread
(отdata.table
пакет) читает файл, но добавляетļ»æ
в начале имени первой переменной:
> names(frame_pers)[1]
[1] "ļ»æreg_date"
То же самое сread.csv
функция.
В настоящее время я создал функцию, которая удаляет спецификацию из имени первого столбца, но я считаю, что должен быть способ автоматического удаления спецификации.
remove.BOM <- function(x) setnames(x, 1, substring(names(x)[1], 4))
> names(frame_pers)[1]
[1] "ļ»æreg_date"
> remove.BOM(frame_pers)
> names(frame_pers)[1]
[1] "reg_date"
Я использую нативную кодировку для сеанса R:
> options("encoding" = "")
> options("encoding")
$encoding
[1] ""