Это сработало, спасибо? Не могли бы вы дать правильный ответ, объясняющий, почему работает latin1, а не ISO-8895-1 (какой символ установлен в исходном коде страницы)?

аюсь перебратьстраница, Я думал об использовании пакета rvest. Тем не менее, я застрял на первом этапе, который заключается в использовании read_html для чтения содержимого. Вот мой код:

library(rvest)
url <- "http://simec.mec.gov.br/painelObras/recurso.php?obra=17956"
obra_caridade <- read_html(url,
                        encoding = "ISO-8895-1")

И я получил следующую ошибку:

Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html,  : 
  Input is not proper UTF-8, indicate encoding !
Bytes: 0xE3 0x6F 0x20 0x65 [9]

Я попытался использовать ответы на подобные вопросы, но это не решило мою проблему:

obra_caridade <- read_html(iconv(url, to = "UTF-8"),
                        encoding = "UTF-8")

obra_caridade <- read_html(iconv(url, to = "ISO-8895-1"),
                        encoding = "ISO-8895-1")

Обе попытки вернули похожую ошибку. У кого-нибудь есть предложения о том, как решить эту проблему? Вот информация о моей сессии:

R version 3.3.1 (2016-06-21)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)

locale:
[1] LC_COLLATE=Portuguese_Brazil.1252  LC_CTYPE=Portuguese_Brazil.1252   
[3] LC_MONETARY=Portuguese_Brazil.1252 LC_NUMERIC=C                      
[5] LC_TIME=Portuguese_Brazil.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] rvest_0.3.2 xml2_1.1.1 

loaded via a namespace (and not attached):
[1] httr_1.2.1   magrittr_1.5 R6_2.2.1     tools_3.3.1  curl_2.6     Rcpp_0.12.11

Ответы на вопрос(0)

Ваш ответ на вопрос