Was ist der Standard-Inhaltstyp / Zeichensatz?

Nach dieser Antwort:urllib2 in Unicode lesen

Ich muss den Inhaltstyp abrufen, um zu Unicode wechseln zu können. Einige Websites haben jedoch keinen "Zeichensatz".

Zum Beispiel der ['content-type'] fürdiese Seite ist "Text / HTML". Ich kann es nicht in Unicode konvertieren.

encoding=urlResponse.headers['content-type'].split('charset=')[-1]
htmlSource = unicode(htmlSource, encoding)
TypeError: 'int' object is not callable

Gibt es eine "Standardcodierung" (natürlich Englisch) ... damit ich diese verwenden kann, wenn nichts gefunden wird?

Antworten auf die Frage(5)

Ihre Antwort auf die Frage