La codificación del módulo de solicitudes proporciona una codificación diferente a la codificación HTML
El módulo de solicitudencoding
proporciona una codificación diferente a la codificación del conjunto real en la página HTML
Código:
import requests
URL = "http://www.reynamining.com/nuevositio/contacto.html"
obj = requests.get(URL, timeout=60, verify=False, allow_redirects=True)
print obj.encoding
Salida:
ISO-8859-1
Donde como el conjunto de codificación real en el HTML esUTF-8
content="text/html; charset=UTF-8"
Mi pregunta es:
Por que esrequests.encoding
mostrando una codificación diferente a la codificación descrita en la página HTML ?.Estoy tratando de convertir la codificación en UTF-8 usando este métodoobjReq.content.decode(encodes).encode("utf-8")
ya que ya está enUTF-8
cuando decodifico con ISO-8859-1 y codifico con UTF-8, los valores cambian, es decir)á
cambios a estoÃ
¿Hay alguna forma de convertir todo tipo de codificaciones en UTF-8?