A codificação do módulo de solicitações fornece codificação diferente da codificação HTML
O módulo de solicitaçãoencoding
fornece codificação diferente da codificação definida na página HTML
Código:
import requests
URL = "http://www.reynamining.com/nuevositio/contacto.html"
obj = requests.get(URL, timeout=60, verify=False, allow_redirects=True)
print obj.encoding
Resultado:
ISO-8859-1
Onde, como a codificação real definida no HTML éUTF-8
content="text/html; charset=UTF-8"
Minha pergunta é:
Porque érequests.encoding
mostrando codificação diferente da codificação descrita na página HTML ?.Estou tentando converter a codificação em UTF-8 usando este métodoobjReq.content.decode(encodes).encode("utf-8")
já que já está emUTF-8
quando decodificar com ISO-8859-1 e codificar com UTF-8, os valores são alterados, ou seja)á
muda para issoÃ
Existe alguma maneira de converter todos os tipos de códigos em UTF-8?