¿Cómo reparar la codificación utf-8 rota en Python?
Mi cuerda esNiệm Bồ Tát (Thiá»n sÆ° Nhất Hạnh)
y quiero decodificarlo paraNiệm Bồ Tát (Thiền sư Nhất Hạnh)
. Veo en ese sitio puede hacer esohttp://www.enderminh.com/minh/utf8-to-unicode-converter.aspx
y empiezo a probar por Python
mystr = '09. Bát Nhã Tâm Kinh'
mystr.decode('utf-8')
pero en realidad no es correcto porque la cadena original es utf-8 pero el show de cadena no es mi resultado esperado.
Nota: es el carácter vietnamita.
¿Cómo resolver ese caso? ¿Es eso Windows Unicode o algo así? Cómo detectar la codificación aquí.