Interpretuj „zwykły tekst” jako tekst utf-8 w Pythonie
Mam plik tekstowy z tekstem, który powinien być zinterpretowany jako utf-8, ale nie był (został mi podany w ten sposób). Oto przykład typowej linii pliku:
u30ed 30f3 u30c9 u30f3 u5728 u4f4f
które powinno być:
ロ ン ド ン 在 住
Teraz mogę to zrobić ręcznie w Pythonie, wpisując następujące polecenie w linii poleceń:
>>> h1 = u'\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f'
>>> print h1
ロンドン在住
co daje mi to, czego chcę. Czy jest sposób, aby to zrobić automatycznie? Próbowałem robić takie rzeczy
>>> f = codecs.open('testfile.txt', encoding='utf-8')
>>> h = f.next()
>>> print h
\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f
Próbowałem także z funkcjami „encode” i „decode”, jakimiś pomysłami?
Dzięki!