Dlaczego Python nie wyświetla tego tekstu poprawnie? (Problem z dekodowaniem UTF-8)
<code>import urllib.request as u zipcode = str(47401) url = 'http://watchdog.net/us/?zip=' + zipcode con = u.urlopen(url) page = str(con.read()) value3 = int(page.find("<title>")) + 7 value4 = int(page.find("</title>")) - 15 district = str(page[value3:value4]) print(district) newdistrict = district.replace("\xe2\x80\x99","'") print(newdistrict) </code>
Z jakiegoś powodu mój kod wciąga tytuł w następującym formacie:IN-09: Indiana\xe2\x80\x99s 9th
. Wiem, że\xe
ciąg znaków to unicode dla'
symbol, ale nie mogę dowiedzieć się, jak uzyskać Pythona, aby zastąpić ten zestaw znaków'
symbol. Próbowałem dekodować łańcuch, ale jest on już w unicode, a powyższy kod nie zmienia niczego. Jakieś porady dotyczące tego, co robię nieprawidłowo?