Was ist der Standard-Inhaltstyp / Zeichensatz?
Nach dieser Antwort:urllib2 in Unicode lesen
Ich muss den Inhaltstyp abrufen, um zu Unicode wechseln zu können. Einige Websites haben jedoch keinen "Zeichensatz".
Zum Beispiel der ['content-type'] fürdiese Seite ist "Text / HTML". Ich kann es nicht in Unicode konvertieren.
encoding=urlResponse.headers['content-type'].split('charset=')[-1]
htmlSource = unicode(htmlSource, encoding)
TypeError: 'int' object is not callable
Gibt es eine "Standardcodierung" (natürlich Englisch) ... damit ich diese verwenden kann, wenn nichts gefunden wird?