Interpretuj „zwykły tekst” jako tekst utf-8 w Pythonie

Question

Jun 18, 2012, 06:36 PM

Interpretuj „zwykły tekst” jako tekst utf-8 w Pythonie

Mam plik tekstowy z tekstem, który powinien być zinterpretowany jako utf-8, ale nie był (został mi podany w ten sposób). Oto przykład typowej linii pliku:

u30ed 30f3 u30c9 u30f3 u5728 u4f4f

które powinno być:

ロンドン在住

Teraz mogę to zrobić ręcznie w Pythonie, wpisując następujące polecenie w linii poleceń:

>>> h1 = u'\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f'    
>>> print h1
ロンドン在住

co daje mi to, czego chcę. Czy jest sposób, aby to zrobić automatycznie? Próbowałem robić takie rzeczy

>>> f = codecs.open('testfile.txt', encoding='utf-8')
>>> h = f.next()
>>> print h
\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f

Próbowałem także z funkcjami „encode” i „decode”, jakimiś pomysłami?

Dzięki!

questionAnswers(1)

Popularne pytania

0 odpowiedzi

Jak zacząć z PyWin32 [zamknięte]

0 odpowiedzi

Znaki Unicode w Regex

0 odpowiedzi

Określony token bariery synchronizacji kolejki komunikatów nie został opublikowany

0 odpowiedzi

Nie wyświetlaj ponownie komunikatów już wyświetlanych w oknie dialogowym w <p: wiadomości autoUpdate = „true”>

0 odpowiedzi

WakeLock nie działa

Jesteś bardzo aktywny! To świetnie!

Interpretuj „zwykły tekst” jako tekst utf-8 w Pythonie

questionAnswers(1)

yourAnswerToTheQuestion

Popularne pytania