Как определить правильную кодировку файла для использования с read.fwf (или использовать обходной путь для удаления несоответствующих символов)

Я попробовал подход в следующем вопросе и все еще застрял.

Как определить правильную кодировку для read.csv?

Этот следующий код должен воспроизводиться ... Есть идеи? Я бы предпочел не использовать scan () или readLines, потому что в прошлом я успешно использовал этот код для различных данных ACS на уровне состояния ....

Моя другая мысль - отредактировать текстовый файл перед его импортом. Однако я храню файлы в архиве и использую скрипт для распаковки, а затем доступа к данным. Необходимость отредактировать файл за пределами среды R на самом деле привела бы к этому. Заранее спасибо!

Filename <- "g20095us.txt"
Url <- "http://www2.census.gov/acs2005_2009_5yr/summaryfile/2005-2009_ACSSF_By_State_By_Sequence_Table_Subset/UnitedStates/All_Geographies_Not_Tracts_Block_Groups/"

Widths <- c(6,2,3,2,7,1,1,1,2,2,3,5,5,6,1,5,4,5,1,3,5,5,5,3,5,1,1,5,3,5,5,5,2,3,
        3,6,3,5,5,5,5,5,1,1,6,5,5,40,200,6,1,50)
Classes <- c(rep('character',4),'integer',rep('character',47))
Names <- c('fileid','stusab','sumlev','geocomp','logrecno','us','region','division',
       'statece','state','county','cousub','place','tract','blkgrp','concit',
       rep('blank',14),'ua',rep('blank',11),'ur',rep('blank',4),'geoid','name',rep('blank',3))
GeoHeader <- read.fwf(paste0(Url,Filename),widths=Widths,
                  colClasses=Classes,col.names=Names,fill=TRUE,strip.white=TRUE)

Четыре строки из файла "g2009us.txt" ниже. Второй "Canoncito" вызывает проблемы. Другие файлы в загружаемом файле - CSV, но этот файл имеет фиксированную ширину и необходим для определения географии интересов (организация данных не очень интуитивно понятна).

ACSSF US251000000964 2430 090 25100US2430090 Кэмерон, Глава, Целевая земля по резервированию и резервированию наций навахо, AZ - NM - UT ACSSF US251000000965 2430 092 25100US2430092 Глава Cañoncito, Земля по резервированию и резервированию наций навахо, AZ - NM - UT ACSSF US251000000966 2430 095 25100US2430095 Глава озера Касамеро, Целевая земля по сохранению и резервированию наций навахо, AZ - NM - UT ACSSF US251000000967 2430 105 25100US2430105 Глава Чи Ча Таха, Целевая земля по резервированию и резервированию наций навахо, AZ - NM --UT

Ответы на вопрос(1)

Ваш ответ на вопрос