ie @ Requests-Modulcodierung bietet eine andere Codierung als die HTML-Codierung.
Das Anforderungsmodulencoding
bietet eine andere Kodierung als die tatsächlich eingestellte Kodierung in der HTML-Seite
Code
import requests
URL = "http://www.reynamining.com/nuevositio/contacto.html"
obj = requests.get(URL, timeout=60, verify=False, allow_redirects=True)
print obj.encoding
Ausgabe
ISO-8859-1
Wo ist die tatsächliche im HTML festgelegte KodierungUTF-8
content="text/html; charset=UTF-8"
Meine Frage sind:
Warum istrequests.encoding
zeigt eine andere Kodierung als die auf der HTML-Seite beschriebene?.Ich versuche, die Kodierung mit dieser Methode in UTF-8 umzuwandelnobjReq.content.decode(encodes).encode("utf-8")
da es schon in @ iUTF-8
Wenn ich mit ISO-8859-1 dekodiere und mit UTF-8 kodiere, werden die Werte geändert, d. h.)á
wechselt zu diesemÃ
Gibt es eine Möglichkeit, alle Arten von Codierungen in UTF-8 zu konvertieren?